Hem Personliga finanser Alternativa distributionsformfaktorer för Hadoop dummies

Alternativa distributionsformfaktorer för Hadoop dummies

Innehållsförteckning:

Video: TEODORA - ALTERNATIVA (OFFICIAL VIDEO) 2025

Video: TEODORA - ALTERNATIVA (OFFICIAL VIDEO) 2025
Anonim

Om Hadoop fungerar bäst när det installeras på en fysisk dator, där bearbetningen har direkt tillgång till dedikerad lagring och nätverk, har Hadoop alternativa implementeringar. Och även om de är mindre effektiva än den dedikerade hårdvaran, är alternativ i vissa fall bra alternativ.

Virtuella servrar

En stor trend i IT-centra under det senaste decenniet är virtualisering, där en stor server kan vara värd för flera "virtuella maskiner" som ser ut och fungerar som enstaka maskiner. I stället för dedikerad hårdvara används en organisations hela uppsättning program och repositorier på virtualiserad hårdvara.

Detta tillvägagångssätt har många fördelar: Centraliseringen av IT förenklar underhållet, IT-investeringarna maximeras på grund av färre oanvända CPU-cykler och det totala hårdvarufotet är lägre vilket resulterar i en lägre total ägandekostnad.

Organisationer där IT-implementeringar är helt virtualiserade mandat att varje ny applikation följer denna modell. Även om Hadoop kan distribueras på detta sätt, i huvudsak som ett virtuellt kluster (med virtuella mästerknoder och virtuella slavnoder), uppstår prestanda, delvis för att för de flesta virtualiserade miljöer är lagring SAN-baserad och inte lokalt kopplad.

Eftersom Hadoop är utformad för att fungera bäst när alla tillgängliga CPU-kärnor har snabb åtkomst till självständigt roterande skivor skapas en flaskhals som hela kartan och reducerar uppgifterna och börjar bearbeta data via det begränsade nätverket mellan processorerna och SAN. Eftersom graden av isolering mellan virtualiserade serverresurser är begränsad (virtuella servrar delar resurser med varandra), kan Hadops arbetsbelastningar också påverkas av annan aktivitet.

När din virtuella serverns prestanda påverkas av en annan servers arbetsbelastning, är det faktiskt känt i IT-kretsar som ett problem med bullriga grannar!

Virtuella miljöer kan dock vara ganska användbara, i vissa fall. Om din organisation exempelvis behöver komplettera en engångsanalys av en stor dataset, kan du enkelt skapa ett tillfälligt kluster i din virtualiserade miljö. Denna metod är ofta ett snabbare sätt att få internt godkännande än att uthärda de byråkratiska problemen med att skaffa ny dedikerad hårdvara.

När du experimenterar med Hadoop kör du det ofta på dina bärbara datorer via en virtuell maskin (VM). Hadoop är extremt långsam i denna typ av miljö, men om du använder små datasatser är det ett värdefullt lärande och testverktyg.

Cloud-implementeringar

Variationer av virtualiserade miljöer är cloud computing-leverantörer som Amazon, Rackspace och IBM SoftLayer. De flesta stora offentliga molnleverantörer har nu MapReduce eller Hadoop-erbjudanden tillgängliga för användning. Återigen är deras prestanda sämre än att använda ditt kluster på dedikerad hårdvara, men det förbättras.

Cloud-leverantörer gör Hadoop-optimerade miljöer tillgängliga där slavnoder har lokalt lagring och dedikerat nätverk. Hypervisorer blir också mycket effektivare, med minskad överhuvud och latens.

Betrakta inte en molnlösning för långsiktiga applikationer, eftersom kostnaden för att hyra molnberäkningsresurser är betydligt högre än att ägna och behålla ett jämförbart system. Med en molnleverantör betalar du för enkelhets skyld och för att kunna ladda upp överhead av provisioning-hårdvara. Molnet är dock en idealisk plattform för testning, utbildning och engångsuppgifter för databehandling.

Bortsett från prestations- och kostnadsöverväganden har du regleringshänsyn med offentliga molnutläggningar. Om du har känslig data, som måste lagras antingen in-house eller in-country, är det inte ett alternativ att använda det offentliga molnet. I sådana fall, där du behöver bekvämligheten med en molnbaserad utplacering, är ett privat moln ett bra alternativ om det är tillgängligt.

Alternativa distributionsformfaktorer för Hadoop dummies

Redaktörens val

Vad är en Java-karta? - dummies

Vad är en Java-karta? - dummies

Arrays och specialiserade listor gör det möjligt att utföra en fantastisk uppsättning uppgifter med Java. Det finns dock situationer där en Java-applikation behöver något som är mer relaterat till en databas, utan att egentligen ha allt databasbagage (som att behöva köpa en separat applikation). Till exempel kanske du vill kunna ...

Några få saker om Java Math - dummies

Några få saker om Java Math - dummies

Tro det eller inte, datorer - även de mest kraftfulla - Ha vissa begränsningar när det gäller att utföra matematiska beräkningar. Dessa begränsningar är vanligtvis obetydliga, men ibland slår de sig och biter på dig. Här är de saker du behöver se upp för när du gör matte i Java. Helhetsflöde Det grundläggande problemet ...

Vad är recursion i Java Programmering? - dummies

Vad är recursion i Java Programmering? - dummies

Rekursion är en grundläggande programmeringsteknik som du kan använda i Java, där en metod kallar sig för att lösa ett problem. En metod som använder denna teknik är rekursiv. Många programmeringsproblem kan lösas endast genom rekursion, och vissa problem som kan lösas med andra tekniker löses bättre genom rekursion. En av ...

Redaktörens val

4 Måste-inkludera i din blogg sidobardesign - dummies

4 Måste-inkludera i din blogg sidobardesign - dummies

Din bloggens sidofält är viktig fastighet som bör innehålla de element du vill ha mest. När du utformar din blogg sidofält kan du dra från en nästan oändlig lista över sidospårelement. Genom att välja noggrant vad som ska inkluderas (och vad som inte ska inkluderas) kan du ställa in din blogg från andra.

5 Användbara Wordpress Plugins - dummies

5 Användbara Wordpress Plugins - dummies

Om du bloggar på en självhävd plattform med WordPress-programvara, är det dags att anpassa din blogg med plug-ins - programvara som kan "anslutas" till din befintliga WordPress bloggprogramvara. Plug-ins gör det möjligt för dig att göra allt från funktionsbildspel i dina blogginlägg för att ansluta sociala medier till din webbplats. Här är fem användbara ...

7 Sätt att erövra Writer's Block som en Blogger - dummies

7 Sätt att erövra Writer's Block som en Blogger - dummies

Varje bloggare möter författarens block i ett tid eller annan. Om du är den typ av bloggare som sköter innehåll varje dag, kan författarens block vara stäverande. Kan du inte ta en paus för att få ditt skrivande mojo tillbaka? Prova en (eller flera) av dessa sju sätt att slå författarens block för att få dig tillbaka ...

Redaktörens val

10 Stora elektronikkomponentkällor - dummies

10 Stora elektronikkomponentkällor - dummies

Letar du efter några bra källor till dina elektroniska delar? Denna lista ger dig några fleråriga favoriter, både inom och utanför Nordamerika. Denna lista är inte uttömmande. Du hittar bokstavligen tusentals specialutbud för ny och begagnad elektronik. Plus, Amazon och eBay ger virtuella marknadsplatser för alla sorters säljare - ...

Elektronik Basics: Resistance - dummies

Elektronik Basics: Resistance - dummies

I elektronikvärlden är motståndet inte meningslöst. Faktum är att motstånd kan vara mycket användbart. Utan motstånd skulle elektronik inte vara möjligt. Elektronik handlar om att manipulera strömmen av ström, och ett av de mest grundläggande sätten att manipulera strömmen är att minska det genom resistans. Utan motstånd strömmar strömmen oreglerad och där ...

Digital elektronik: Så här installerar du BASIC Stamp Editor och Anslut till Stämpeldummorna

Digital elektronik: Så här installerar du BASIC Stamp Editor och Anslut till Stämpeldummorna

För att berätta för BASIC Stamp vad du vill göra i ditt digitala elektronikprojekt måste du programmera det. BASIC Stamp Windows Editor är den programvara som du använder på din dator för att skapa program som kan laddas ner till en BASIC Stamp-mikrokontroller. Denna programvara är tillgänglig gratis från Parallax webbplats. ...