Hem Personliga finanser Hadoop som ett frågeformulär för Cold Warehouse Data - dummies

Hadoop som ett frågeformulär för Cold Warehouse Data - dummies

Video: Howto install hadoop on Ubuntu 2024

Video: Howto install hadoop on Ubuntu 2024
Anonim

En mängd studier visar att de flesta data i ett företagsdatabutik sällan är ifrågasatta. Databasleverantörer har svarat på sådana observationer genom att implementera sina egna metoder för att sortera ut vilken data som placeras där.

En metod beställer datalunet i beteckningar för hett, varmt eller kallt, var hett data (ibland kallad aktiv data) används ofta varma data används från tid till annan, och kall data används sällan. Den föreslagna lösningen för många leverantörer är att lagra kyla data på långsammare diskar i datalagerhusen eller för att skapa klara cachingstrategier för bland annat att hålla heta data i minnet.

Problemet med denna metod det är trots att långsammare lagring används, är det fortfarande dyrt att lagra kyla, sällan använda data i ett lager. Kostnaderna här härrör från båda maskin- och programvarulicens. Samtidigt arkiveras kalla och vilande data ofta till tejp.

Denna traditionella modell för arkivering av data bryts ner när du vill fråga alla kalla data på ett kostnadseffektivt och relativt effektivt sätt - utan att behöva begära gamla band, med andra ord.

Om du tittar på kostnaden och operativa egenskaperna hos Hadoop, verkar det verkligen som om det kommer att bli den nya reservbandet. Hadoop är billigt till stor del för att Hadoop-system är utformade för att använda en lägre maskinvara än vad som normalt används i datalagringssystem. En annan betydande kostnadsbesparing är programvarulicens.

Commercial Hadoop-distributionslicenser kräver en bråkdel av kostnaden för licenser för relationsdatalagringsprogramvaror, som är berömda för att vara dyra. Från ett operativt perspektiv har Hadoop utformats för att enkelt skala bara genom att lägga till ytterligare slavnoder till ett befintligt kluster. Och som slavnodder läggs till och dataseten växer i volym, möjliggör Hadops databehandlingsramar att dina applikationer hanterar den ökade arbetsbelastningen smidigt.

Hadoop representerar ett enkelt, flexibelt och billigt sätt att driva processen över bokstavligen tusentals servrar.

Med sin skalbara och billiga arkitektur skulle Hadoop vara ett perfekt val för arkivering av lagerdata … förutom en liten sak: Det mesta av IT-världen körs på SQL, och SQL i sig spelar inte bra med Hadoop.

Visst, den mer Hadoop-vänliga NoSQL-rörelsen är levande och bra, men de flesta strömanvändare använder nu SQL genom vanliga verktygshjälpmedel som genererar SQL-frågor under huven - produkter som Tableau, Microsoft Excel, och IBM Cognos BI.

Det är sant att Hadoop-ekosystemet innehåller Hive, men Hive stöder endast en delmängd av SQL, och även om prestanda förbättras (tillsammans med SQL-stöd) är det inte så snabbt att svara på mindre frågor som relationssystem är. Nyligen har det gjorts stora framsteg kring SQL-åtkomst till Hadoop, vilket har banat vägen för Hadoop att bli den nya destinationen för arkiv för online-datalager.

Beroende på Hadoop-leverantören blir SQL (eller SQL-liknande) API-apparater tillgängliga så att de vanligaste rapporterna och analysverktygen för rader kan problemfritt utfärda SQL som körs på data som lagras i Hadoop. Till exempel har IBM sitt stora SQL API, Cloudera har Impala och Hive själv, via Hortonworks Stinger-initiativet, blir alltmer SQL-kompatibelt.

Även om olika synvinklar finns (vissa syftar till att förbättra Hive, vissa, för att utvidga Hive och andra, för att ge ett alternativ), försöker alla dessa lösningar att ta itu med två problem: MapReduce är en dålig lösning för att utföra mindre frågor, och SQL-åtkomst är - för tillfället - nyckeln till att IT-anställda kan använda sina befintliga SQL-färdigheter för att få värdet av data lagrade i Hadoop.

Hadoop som ett frågeformulär för Cold Warehouse Data - dummies

Redaktörens val

Hur man lägger till text i en sätter () Funktion i C Programmering

Hur man lägger till text i en sätter () Funktion i C Programmering

När du behöver visa en annan textrad, använd C-programmeringsfärdigheterna för att skapa en annan puts () -funktion i källkoden, som visas i Visa två textlinjer. VISA TILL TEXTFINER # inkludera int main () {sätter ("Hickory, Dickory, Dock,"); sätter ("musen sprang klockan."); returnera (0);} Den andra ...

Förklarar variabler i C-dummies

Förklarar variabler i C-dummies

Variabler är det som gör dina program zooma. Programmering kan bara inte bli gjort utan dem. Så om du inte har introducerats till variabler än, här går du. Valerie Variable är en numerisk variabel. Hon älskar att hålla nummer - vilket nummer som helst; det spelar ingen roll. När hon ser ett lika tecken tar hon ett värde och ...

Redaktörens val

Gör rädsla för din vän - dummies

Gör rädsla för din vän - dummies

Rädsla är lika verklig som mod. Även om värdet av rädsla inte är lika uppenbart som modets värde, har det dess fördelar. Rädsla är din instinkt som säger att du är obehaglig - även om situationen inte kommer att skada dig. Alla har haft den känslan när man hellre drar locket ...

Hur man ökar din självmedvetenhet - dummies

Hur man ökar din självmedvetenhet - dummies

Du kommer att vara med dig själv under en livstid. Ingenting kommer att förändra det faktum. Att lära känna, som att lyssna på och uppskatta själv är avgörande för din sanity. Kanske kommer du till att älska, acceptera och omfamna alla du är, är svår för dig att föreställa dig just nu, men du kan göra ...

Hur man ökar din mentala flexibilitet - dummies

Hur man ökar din mentala flexibilitet - dummies

ÄR flexibel i arbete och relationer är ett tecken på en högpresterande. Medan perfektionister är styva och obehagliga i sitt arbete och hur de interagerar med andra, är högpresterande mer öppna och tillmötesgående. Att vara mer flexibel på jobbet gav Ralph aldrig förslag under brainstorming vid gruppmöten. Han kände att hans lag ...

Redaktörens val

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Linux är i sig ett kommandoradsorienterat operativsystem. Grafiska användargränssnitt - inklusive installationsprogrammets GUI - tillhandahålls av en valfri komponent som heter X Window System. Men medan du arbetar med det grafiska användargränssnittet för installationsprogrammet, håller Linux flera ytterligare kommandorads-konsoler öppna. Normalt behöver du inte ...

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Alla användare som åtkomst ett Linux-system, lokalt eller över ett nätverk, måste verifieras av ett giltigt användarkonto på systemet. I det följande får du veta hur du loggar in och ut på ett Linux-system och hur du stänger av systemet. Logga in När Linux startar upp visas det ...

Nätverksadministration: Licensserver - Dummies

Nätverksadministration: Licensserver - Dummies

I vissa program kan du köpa nätverkslicenser som gör att du kan installera programvaran på många datorer som du vill, men reglera antalet personer som kan använda programvaran vid en viss tidpunkt. För att styra hur många som använder programvaran, är en särskild licensserver inrättad. När en användare börjar ...