Hem Personliga finanser Alternativa distributionsformfaktorer för Hadoop dummies

Alternativa distributionsformfaktorer för Hadoop dummies

Innehållsförteckning:

Video: TEODORA - ALTERNATIVA (OFFICIAL VIDEO) 2024

Video: TEODORA - ALTERNATIVA (OFFICIAL VIDEO) 2024
Anonim

Om Hadoop fungerar bäst när det installeras på en fysisk dator, där bearbetningen har direkt tillgång till dedikerad lagring och nätverk, har Hadoop alternativa implementeringar. Och även om de är mindre effektiva än den dedikerade hårdvaran, är alternativ i vissa fall bra alternativ.

Virtuella servrar

En stor trend i IT-centra under det senaste decenniet är virtualisering, där en stor server kan vara värd för flera "virtuella maskiner" som ser ut och fungerar som enstaka maskiner. I stället för dedikerad hårdvara används en organisations hela uppsättning program och repositorier på virtualiserad hårdvara.

Detta tillvägagångssätt har många fördelar: Centraliseringen av IT förenklar underhållet, IT-investeringarna maximeras på grund av färre oanvända CPU-cykler och det totala hårdvarufotet är lägre vilket resulterar i en lägre total ägandekostnad.

Organisationer där IT-implementeringar är helt virtualiserade mandat att varje ny applikation följer denna modell. Även om Hadoop kan distribueras på detta sätt, i huvudsak som ett virtuellt kluster (med virtuella mästerknoder och virtuella slavnoder), uppstår prestanda, delvis för att för de flesta virtualiserade miljöer är lagring SAN-baserad och inte lokalt kopplad.

Eftersom Hadoop är utformad för att fungera bäst när alla tillgängliga CPU-kärnor har snabb åtkomst till självständigt roterande skivor skapas en flaskhals som hela kartan och reducerar uppgifterna och börjar bearbeta data via det begränsade nätverket mellan processorerna och SAN. Eftersom graden av isolering mellan virtualiserade serverresurser är begränsad (virtuella servrar delar resurser med varandra), kan Hadops arbetsbelastningar också påverkas av annan aktivitet.

När din virtuella serverns prestanda påverkas av en annan servers arbetsbelastning, är det faktiskt känt i IT-kretsar som ett problem med bullriga grannar!

Virtuella miljöer kan dock vara ganska användbara, i vissa fall. Om din organisation exempelvis behöver komplettera en engångsanalys av en stor dataset, kan du enkelt skapa ett tillfälligt kluster i din virtualiserade miljö. Denna metod är ofta ett snabbare sätt att få internt godkännande än att uthärda de byråkratiska problemen med att skaffa ny dedikerad hårdvara.

När du experimenterar med Hadoop kör du det ofta på dina bärbara datorer via en virtuell maskin (VM). Hadoop är extremt långsam i denna typ av miljö, men om du använder små datasatser är det ett värdefullt lärande och testverktyg.

Cloud-implementeringar

Variationer av virtualiserade miljöer är cloud computing-leverantörer som Amazon, Rackspace och IBM SoftLayer. De flesta stora offentliga molnleverantörer har nu MapReduce eller Hadoop-erbjudanden tillgängliga för användning. Återigen är deras prestanda sämre än att använda ditt kluster på dedikerad hårdvara, men det förbättras.

Cloud-leverantörer gör Hadoop-optimerade miljöer tillgängliga där slavnoder har lokalt lagring och dedikerat nätverk. Hypervisorer blir också mycket effektivare, med minskad överhuvud och latens.

Betrakta inte en molnlösning för långsiktiga applikationer, eftersom kostnaden för att hyra molnberäkningsresurser är betydligt högre än att ägna och behålla ett jämförbart system. Med en molnleverantör betalar du för enkelhets skyld och för att kunna ladda upp överhead av provisioning-hårdvara. Molnet är dock en idealisk plattform för testning, utbildning och engångsuppgifter för databehandling.

Bortsett från prestations- och kostnadsöverväganden har du regleringshänsyn med offentliga molnutläggningar. Om du har känslig data, som måste lagras antingen in-house eller in-country, är det inte ett alternativ att använda det offentliga molnet. I sådana fall, där du behöver bekvämligheten med en molnbaserad utplacering, är ett privat moln ett bra alternativ om det är tillgängligt.

Alternativa distributionsformfaktorer för Hadoop dummies

Redaktörens val

Hur man lägger till text i en sätter () Funktion i C Programmering

Hur man lägger till text i en sätter () Funktion i C Programmering

När du behöver visa en annan textrad, använd C-programmeringsfärdigheterna för att skapa en annan puts () -funktion i källkoden, som visas i Visa två textlinjer. VISA TILL TEXTFINER # inkludera int main () {sätter ("Hickory, Dickory, Dock,"); sätter ("musen sprang klockan."); returnera (0);} Den andra ...

Förklarar variabler i C-dummies

Förklarar variabler i C-dummies

Variabler är det som gör dina program zooma. Programmering kan bara inte bli gjort utan dem. Så om du inte har introducerats till variabler än, här går du. Valerie Variable är en numerisk variabel. Hon älskar att hålla nummer - vilket nummer som helst; det spelar ingen roll. När hon ser ett lika tecken tar hon ett värde och ...

Redaktörens val

Gör rädsla för din vän - dummies

Gör rädsla för din vän - dummies

Rädsla är lika verklig som mod. Även om värdet av rädsla inte är lika uppenbart som modets värde, har det dess fördelar. Rädsla är din instinkt som säger att du är obehaglig - även om situationen inte kommer att skada dig. Alla har haft den känslan när man hellre drar locket ...

Hur man ökar din självmedvetenhet - dummies

Hur man ökar din självmedvetenhet - dummies

Du kommer att vara med dig själv under en livstid. Ingenting kommer att förändra det faktum. Att lära känna, som att lyssna på och uppskatta själv är avgörande för din sanity. Kanske kommer du till att älska, acceptera och omfamna alla du är, är svår för dig att föreställa dig just nu, men du kan göra ...

Hur man ökar din mentala flexibilitet - dummies

Hur man ökar din mentala flexibilitet - dummies

ÄR flexibel i arbete och relationer är ett tecken på en högpresterande. Medan perfektionister är styva och obehagliga i sitt arbete och hur de interagerar med andra, är högpresterande mer öppna och tillmötesgående. Att vara mer flexibel på jobbet gav Ralph aldrig förslag under brainstorming vid gruppmöten. Han kände att hans lag ...

Redaktörens val

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Linux är i sig ett kommandoradsorienterat operativsystem. Grafiska användargränssnitt - inklusive installationsprogrammets GUI - tillhandahålls av en valfri komponent som heter X Window System. Men medan du arbetar med det grafiska användargränssnittet för installationsprogrammet, håller Linux flera ytterligare kommandorads-konsoler öppna. Normalt behöver du inte ...

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Alla användare som åtkomst ett Linux-system, lokalt eller över ett nätverk, måste verifieras av ett giltigt användarkonto på systemet. I det följande får du veta hur du loggar in och ut på ett Linux-system och hur du stänger av systemet. Logga in När Linux startar upp visas det ...

Nätverksadministration: Licensserver - Dummies

Nätverksadministration: Licensserver - Dummies

I vissa program kan du köpa nätverkslicenser som gör att du kan installera programvaran på många datorer som du vill, men reglera antalet personer som kan använda programvaran vid en viss tidpunkt. För att styra hur många som använder programvaran, är en särskild licensserver inrättad. När en användare börjar ...