Hem Personliga finanser Hadoop och Hive dummies

Hadoop och Hive dummies

Video: Big Data analysis Hadoop with Mapreduce, HIVE, PIG and Spark class 10 2024

Video: Big Data analysis Hadoop with Mapreduce, HIVE, PIG and Spark class 10 2024
Anonim

För att göra en lång historia kort, ger Hive Hadoop en bro till RDBMS världen och tillhandahåller en SQL-dialekt som kallas Hive Query Language (HiveQL), som kan användas för att utföra SQL-liknande uppgifter. Det är de stora nyheterna, men det finns mer att Hive än vad som stämmer överens med ögat, som de säger, eller fler tillämpningar av den här nya tekniken än vad du kan presentera i en vanlig hissstigning.

Till exempel möjliggör Hive det koncept som kallas Enterprise Data Warehouse (EDW) augmentation, ett ledande användarfall för Apache Hadoop, där datalager är uppbyggda som RDBMSs byggda speciellt för dataanalys och rapportering.

tillägg till företaget och att den kan augment och komplettera befintliga EDWs. Hive, HBase och Sqoop möjliggör EDW augmentation. Nästan förknippad med RDBMS / EDW-tekniken är extrakt, transform och laddningsteknik (ETL). För att förstå vad ETL gör, hjälper det att veta att i många användningsfall inte data kan laddas omedelbart i relationsdatabasen - det måste först utvinnas från sin ursprungliga källa, omvandlas till ett lämpligt format och laddas sedan in i RDBMS eller EDW.

Ett företag eller en organisation kan exempelvis extrahera ostrukturerad textdata från ett internetforum, omvandla data till ett strukturerat format som är både värdefullt och användbart och sedan ladda de strukturerade data i sin EDW.

Du kan se att Hive är ett kraftfullt ETL-verktyg i sin egen rätt, tillsammans med den stora aktören i detta rike: Apache Pig. Igen kan användarna försöka ställa in Hive and Pig som

de nya ETL-verktygen för datacentret. (Låt dem försöka.)

Som med debatten om EDW kontra Apache Hadoop är dessa Apache Hadoop-teknologier inte direkta ersättning s för befintliga ETL-verktyg, utan istället är kraftfulla nya ETL-verktyg att vara används när det är lämpligt. Sist men inte minst, Apache Hive ger dig kraftfulla analysverktyg, allt inom ramen för HiveQL. Dessa verktyg bör se och känna sig välkända för IT-proffs som förstår hur man använder SQL.

Hadoop och Hive dummies

Redaktörens val

Byta lager i PowerPoint 2007 Ritningar - dummies

Byta lager i PowerPoint 2007 Ritningar - dummies

När du har flera objekt på en PowerPoint-bild kan de överlappa varandra. PowerPoint hanterar detta problem genom lagringsobjekt. Det första objektet du ritar är längst ner i stapeln; Det andra objektet ligger ovanpå det första; den tredje är ovanpå det andra objektet; och så vidare. Om två objekt överlappar varandra, ...

Grundläggande kommandon i PowerPoint 2007 - dummies

Grundläggande kommandon i PowerPoint 2007 - dummies

Använd tangentbordsgenvägar i PowerPoint 2007 för att spara tid. Oavsett om du formaterar, redigerar eller bara använder vanliga kommandon i PowerPoint 7, visar den här listan kommandot och knapptryckningskombinationen för att få jobbet gjort. Kommandokoder Kommandotyper Ny Ctrl + N Öppna Ctrl + O Spara Ctrl + S Skriv Ctrl + P Hjälp F1 Ny Slide Ctrl + M Redigering ...

ÄNdra layouten av huvudbilder i PowerPoint 2007 - dummies

ÄNdra layouten av huvudbilder i PowerPoint 2007 - dummies

ÄNdra layouten för en PowerPoint-malls bild innebär att du ändrar positionen och storleken på textramar och innehållsramar på dina PowerPoint-bilder samt att ta bort dessa ramar. PowerPoint-innehållsramar håller grafik, clipart-bilder, tabeller och diagram på plats. Textramar rymmer bildtitlar och punktposter eller numrerade listor. För att ändra ...

Redaktörens val

Hur man använder Komodo Redigera funktioner för HTML5 och CSS3 programmering - dummies

Hur man använder Komodo Redigera funktioner för HTML5 och CSS3 programmering - dummies

Komodo Redigera är en bra textredigerare för HTML5 och CSS3 programmering ... Denna redaktör är extremt kraftfull, men är inte så skrämmande som några av de äldre verktygen. Den har ett modernt strömlinjeformat gränssnitt, men mer kraft än du kanske förstår först. Komodo Edit är faktiskt öppen källkus till en kommersiell integrerad ...

Hur man använder nya CSS3 Selectors - dummies

Hur man använder nya CSS3 Selectors - dummies

CSS3 stöder flera nya väljare med intressanta nya funktioner som du bör bli bekant med. Du kan använda dessa nya funktioner för att förbättra sidorna på ännu bättre sätt än tidigare. Attributval Du kan nu tillämpa en stil på något element med ett specifikt attributvärde. Inmatningstaggen tar till exempel olika former, alla ...

Redaktörens val

Använd Google Analytics för att titta på din blogg referraltrafik - dummies

Använd Google Analytics för att titta på din blogg referraltrafik - dummies

Referraltrafik är trafiken du får det som kommer från andra webbplatser än sökmotorer. Du kan få trafik från sociala medier, t.ex. Facebook, Twitter eller StumbleUpon. Eller du kan få trafik från andra bloggar eller webbplatser som länkar till dig. Genom att titta på de platser där din trafik kommer från (och kommer inte ...

Använd OpenX OnRamp-annonsservern för din mammablogga - dummies

Använd OpenX OnRamp-annonsservern för din mammablogga - dummies

En annonsserver är programvara Det gör att du kan hantera alla dina annonser från ett ställe, även om du har mer än en blogg. Den visar annonser, roterar dem, riktar dem och ger resultatrapporter för dina annonseringsklienter också. OpenX har en fri produkt som heter OpenX OnRamp när du kommer till ...

Använd bilder från andra källor i din blogs design - dummies

Använd bilder från andra källor i din blogs design - dummies

För att förbättra din blogg design, dig kan använda egna bilder eller bilder från andra källor, till exempel stockbilder. Att använda bilder på din blogg är enkelt, eftersom Internet är fullt av platser där du kan hitta bilder som du kan använda på din blogg. En stock bild är ett foto licensierat för ...