Hem Personliga finanser Rollen av traditionell ETL i Big Data - dummies

Rollen av traditionell ETL i Big Data - dummies

Video: AWS Tutorial For Beginners | AWS Full Course - Learn AWS In 10 Hours | AWS Training | Edureka 2024

Video: AWS Tutorial For Beginners | AWS Full Course - Learn AWS In 10 Hours | AWS Training | Edureka 2024
Anonim

ETL-verktyg kombinerar tre viktiga funktioner (extrahera, transformera, ladda) som krävs för att få data från en stor datormiljö och sätta den in i en annan datamiljö. Traditionellt har ETL använts med satsvis bearbetning i datalagringsmiljöer. Datavarehus ger företagsanvändarna ett sätt att konsolidera information för att analysera och rapportera om data som är relevanta för deras affärsfokus. ETL-verktyg används för att omvandla data till det format som krävs av datalager.

Transformationen görs faktiskt i en mellanliggande plats innan data laddas i datalageret. Många programvaruleverantörer, inklusive IBM, Informatica, Pervasive, Talend och Pentaho, tillhandahåller ETL-programvaruverktyg.

ETL tillhandahåller den underliggande infrastrukturen för integration genom att utföra tre viktiga funktioner:

  • Utdrag: Läs data från källdatabasen.

  • Transform: Konvertera formatet för den extraherade data så att den överensstämmer med kraven i måldatabasen. Transformation görs genom att använda regler eller slå samman data med andra data.

  • Ladda: Skriv data till måldatabasen.

ETL utvecklas emellertid för att stödja integration över mycket mer än traditionella datalager. ETL kan stödja integration mellan transaktionssystem, operativdatabutiker, BI-plattformar, MDM-hubbar, molnet och Hadoop-plattformarna. ETL-programvaruförsäljare utvidgar sina lösningar för att ge stor datautvinning, transformation och laddning mellan Hadoop och traditionella datahanteringsplattformar.

ETL och mjukvaruverktyg för andra dataintegrationsprocesser som datautrensning, profilering och revision av allt arbete på olika aspekter av data för att säkerställa att uppgifterna anses trovärdiga. ETL-verktyg integreras med datakvalitetsverktyg, och många innehåller verktyg för datautrensning, datakartläggning och identifiering av datastamning. Med ETL extraherar du bara de data du behöver för integrationen.

ETL-verktyg behövs för laddning och konvertering av strukturerad och ostrukturerad data till Hadoop. Avancerade ETL-verktyg kan läsa och skriva flera filer parallellt från och till Hadoop för att förenkla hur data sammanfogas till en gemensam transformationsprocess. Vissa lösningar innehåller bibliotek av förbyggda ETL-transformationer för både transaktions- och interaktionsdata som körs på Hadoop eller en traditionell nätinfrastruktur.

Datatransformering är processen att ändra formatet på data så att det kan användas av olika applikationer.Detta kan innebära en förändring från det format som data lagras i i det format som behövs av den applikation som ska använda data. Denna process innehåller även mapping instruktioner så att applikationer får veta hur man får de data de behöver för att bearbeta.

Processdatatransformationen görs mycket mer komplex på grund av den svindlande tillväxten i mängden ostrukturerad data. En företagsapplikation, såsom en kundrelationshantering, har särskilda krav på hur data ska lagras. Uppgifterna är sannolikt strukturerade i de organiserade raderna och kolumnerna i en relationsdatabas. Data är halvstrukturerad eller ostrukturerad om den inte följer strikta formatkrav.

Informationen i ett e-postmeddelande anses exempelvis ostrukturerat. Några av företagets viktigaste uppgifter finns i ostrukturerade och halvstrukturerade former såsom dokument, e-postmeddelanden, komplexa meddelanden, kundsupport, transaktioner och information som kommer från paketprogram som ERP och CRM.

Datatransformationsverktyg är inte konstruerade för att fungera bra med ostrukturerad data. Som ett resultat har företag som behöver integrera ostrukturerad information i sitt beslutsprocess för affärsprocesser blivit utsatta för en betydande mängd manuell kodning för att åstadkomma den nödvändiga dataintegrationen.

Med tanke på tillväxten och betydelsen av ostrukturerad data för beslutsfattande, börjar ETL-lösningar från större leverantörer erbjuda standardiserade metoder för att transformera ostrukturerad data så att den lättare kan integreras med operativstrukturerad data.

Rollen av traditionell ETL i Big Data - dummies

Redaktörens val

Hur man lägger till text i en sätter () Funktion i C Programmering

Hur man lägger till text i en sätter () Funktion i C Programmering

När du behöver visa en annan textrad, använd C-programmeringsfärdigheterna för att skapa en annan puts () -funktion i källkoden, som visas i Visa två textlinjer. VISA TILL TEXTFINER # inkludera int main () {sätter ("Hickory, Dickory, Dock,"); sätter ("musen sprang klockan."); returnera (0);} Den andra ...

Förklarar variabler i C-dummies

Förklarar variabler i C-dummies

Variabler är det som gör dina program zooma. Programmering kan bara inte bli gjort utan dem. Så om du inte har introducerats till variabler än, här går du. Valerie Variable är en numerisk variabel. Hon älskar att hålla nummer - vilket nummer som helst; det spelar ingen roll. När hon ser ett lika tecken tar hon ett värde och ...

Redaktörens val

Gör rädsla för din vän - dummies

Gör rädsla för din vän - dummies

Rädsla är lika verklig som mod. Även om värdet av rädsla inte är lika uppenbart som modets värde, har det dess fördelar. Rädsla är din instinkt som säger att du är obehaglig - även om situationen inte kommer att skada dig. Alla har haft den känslan när man hellre drar locket ...

Hur man ökar din självmedvetenhet - dummies

Hur man ökar din självmedvetenhet - dummies

Du kommer att vara med dig själv under en livstid. Ingenting kommer att förändra det faktum. Att lära känna, som att lyssna på och uppskatta själv är avgörande för din sanity. Kanske kommer du till att älska, acceptera och omfamna alla du är, är svår för dig att föreställa dig just nu, men du kan göra ...

Hur man ökar din mentala flexibilitet - dummies

Hur man ökar din mentala flexibilitet - dummies

ÄR flexibel i arbete och relationer är ett tecken på en högpresterande. Medan perfektionister är styva och obehagliga i sitt arbete och hur de interagerar med andra, är högpresterande mer öppna och tillmötesgående. Att vara mer flexibel på jobbet gav Ralph aldrig förslag under brainstorming vid gruppmöten. Han kände att hans lag ...

Redaktörens val

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Linux är i sig ett kommandoradsorienterat operativsystem. Grafiska användargränssnitt - inklusive installationsprogrammets GUI - tillhandahålls av en valfri komponent som heter X Window System. Men medan du arbetar med det grafiska användargränssnittet för installationsprogrammet, håller Linux flera ytterligare kommandorads-konsoler öppna. Normalt behöver du inte ...

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Alla användare som åtkomst ett Linux-system, lokalt eller över ett nätverk, måste verifieras av ett giltigt användarkonto på systemet. I det följande får du veta hur du loggar in och ut på ett Linux-system och hur du stänger av systemet. Logga in När Linux startar upp visas det ...

Nätverksadministration: Licensserver - Dummies

Nätverksadministration: Licensserver - Dummies

I vissa program kan du köpa nätverkslicenser som gör att du kan installera programvaran på många datorer som du vill, men reglera antalet personer som kan använda programvaran vid en viss tidpunkt. För att styra hur många som använder programvaran, är en särskild licensserver inrättad. När en användare börjar ...