Hem Personliga finanser Skikt 4 i Big Data Stack: Analytiska Data Warehouses - Dummies

Skikt 4 i Big Data Stack: Analytiska Data Warehouses - Dummies

Video: Computational Thinking - Computer Science for Business Leaders 2016 2024

Video: Computational Thinking - Computer Science for Business Leaders 2016 2024
Anonim

Datalagret, lager 4 i den stora databacken och dess companion data mart har länge varit de primära tekniker som organisationer använder för att optimera data för att hjälpa beslutsfattare. Typiskt innehåller datalager och mars normaliserade data som samlats in från en mängd olika källor och monteras för att underlätta analysen av verksamheten.

Datavarehus och mars förenklar skapandet av rapporter och visualisering av olika dataposter. De skapas generellt från relationella databaser, multidimensionella databaser, platta filer och objektdatabaser - i huvudsak alla lagringsarkitekturer. I en traditionell miljö, där prestanda kanske inte är högsta prioritet, är valet av den bakomliggande tekniken drivna av kraven för analys, rapportering och visualisering av företagsdata.

Eftersom organisationen av data och dess beredskap för analys är viktiga, hålls de flesta data warehouse implementationerna aktuella via batchbehandling. Problemet är att batchbelastade datalager och data mars kan vara otillräckliga för många stora dataprogram. Spänningen som införs av höghastighetsdataströmmar kommer sannolikt att kräva en mer realtidsinriktning till stora datalager.

Det betyder inte att du inte skapar och matar ett analytiskt datalager eller en datormart med batchprocesser. Snarare kan du sluta ha flera datalager eller data mars, och prestanda och skalan återspeglar tidskraven för analytikerna och beslutsfattarna.

Eftersom många datalager och data mars består av data som samlats in från olika källor inom ett företag, måste också kostnaderna för rengöring och normalisering av data hanteras. Med stora data hittar du några viktiga skillnader:

  • Traditionella dataströmmar (från transaktioner, applikationer osv.) Kan producera mycket olika data.

  • Dussintals nya datakällor finns också, var och en behöver lite manipulation innan det kan vara aktuellt och användbart för verksamheten.

  • Innehållskällor måste också rengöras, och det kan kräva olika tekniker än vad du kan använda med strukturerad data.

Historiskt var innehållet i datalager och data mars organiserade och levererade till företagsledare som ansvarade för strategi och planering. Med stora data utnyttjar en ny uppsättning lag data för beslutsfattande.

Många stora dataimplementeringar ger realtidsfunktioner, så företag ska kunna leverera innehåll så att individer med operativa roller kan hantera problem som kundsupport, försäljningsmöjligheter och serviceavbrott i nära realtid.På så sätt hjälper stora data till att flytta åtgärder från bakkontoret till kontoret.

Befintliga analysverktyg och tekniker kommer att vara till stor hjälp när du känner till stora data. Det finns dock en fångst. Algoritmerna som ingår i dessa verktyg måste kunna arbeta med stora mängder potentiellt realtid och olika data. Infrastrukturen måste vara på plats för att stödja detta.

Och leverantörer som tillhandahåller analysverktyg måste också se till att deras algoritmer fungerar över distribuerade implementeringar. På grund av dessa komplexiteter, förvänta dig en ny klass av verktyg för att hjälpa till att ge mening om stora data.

Det finns tre klasser av verktyg i detta lager av referensarkitekturen. De kan användas oberoende eller kollektivt av beslutsfattare för att hjälpa till att styra verksamheten. De tre klasserna av verktyg är följande:

  • Rapportering och instrumentbrädor: Dessa verktyg ger en & ldquo; användarvänliga & rdquo; representation av informationen från olika källor. Även om det är en grundsten i den traditionella datavärlden, utvecklas detta område fortfarande för stora data. Några av de verktyg som används är traditionella som kan nå tillgång till de nya typerna av databaser som kollektivt kallas NoSQL (Not Only SQL).

  • Visualisering: Dessa verktyg är nästa steg i rapporteringsutvecklingen. Produktionen tenderar att vara mycket interaktiv och dynamisk i naturen. En annan viktig skillnad mellan rapporter och visualiserad produktion är animering. Företagsanvändare kan titta på förändringar i data som använder en mängd olika visualiseringstekniker, inklusive minneskartor, värmekartor, infographics och anslutningsdiagram. Rapportering och visualisering sker vid slutet av affärsverksamheten.

  • Analytics och avancerad analys: Dessa verktyg når in i datalageret och bearbetar data för konsumtion. Avancerad analys bör tydliggöra trender eller händelser som är transformativa, unika eller revolutionerande i befintlig affärspraxis. Prediktiv analys och sentimentanalys är bra exempel på denna vetenskap.

Skikt 4 i Big Data Stack: Analytiska Data Warehouses - Dummies

Redaktörens val

Hur man lägger till text i en sätter () Funktion i C Programmering

Hur man lägger till text i en sätter () Funktion i C Programmering

När du behöver visa en annan textrad, använd C-programmeringsfärdigheterna för att skapa en annan puts () -funktion i källkoden, som visas i Visa två textlinjer. VISA TILL TEXTFINER # inkludera int main () {sätter ("Hickory, Dickory, Dock,"); sätter ("musen sprang klockan."); returnera (0);} Den andra ...

Förklarar variabler i C-dummies

Förklarar variabler i C-dummies

Variabler är det som gör dina program zooma. Programmering kan bara inte bli gjort utan dem. Så om du inte har introducerats till variabler än, här går du. Valerie Variable är en numerisk variabel. Hon älskar att hålla nummer - vilket nummer som helst; det spelar ingen roll. När hon ser ett lika tecken tar hon ett värde och ...

Redaktörens val

Gör rädsla för din vän - dummies

Gör rädsla för din vän - dummies

Rädsla är lika verklig som mod. Även om värdet av rädsla inte är lika uppenbart som modets värde, har det dess fördelar. Rädsla är din instinkt som säger att du är obehaglig - även om situationen inte kommer att skada dig. Alla har haft den känslan när man hellre drar locket ...

Hur man ökar din självmedvetenhet - dummies

Hur man ökar din självmedvetenhet - dummies

Du kommer att vara med dig själv under en livstid. Ingenting kommer att förändra det faktum. Att lära känna, som att lyssna på och uppskatta själv är avgörande för din sanity. Kanske kommer du till att älska, acceptera och omfamna alla du är, är svår för dig att föreställa dig just nu, men du kan göra ...

Hur man ökar din mentala flexibilitet - dummies

Hur man ökar din mentala flexibilitet - dummies

ÄR flexibel i arbete och relationer är ett tecken på en högpresterande. Medan perfektionister är styva och obehagliga i sitt arbete och hur de interagerar med andra, är högpresterande mer öppna och tillmötesgående. Att vara mer flexibel på jobbet gav Ralph aldrig förslag under brainstorming vid gruppmöten. Han kände att hans lag ...

Redaktörens val

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Linux är i sig ett kommandoradsorienterat operativsystem. Grafiska användargränssnitt - inklusive installationsprogrammets GUI - tillhandahålls av en valfri komponent som heter X Window System. Men medan du arbetar med det grafiska användargränssnittet för installationsprogrammet, håller Linux flera ytterligare kommandorads-konsoler öppna. Normalt behöver du inte ...

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Alla användare som åtkomst ett Linux-system, lokalt eller över ett nätverk, måste verifieras av ett giltigt användarkonto på systemet. I det följande får du veta hur du loggar in och ut på ett Linux-system och hur du stänger av systemet. Logga in När Linux startar upp visas det ...

Nätverksadministration: Licensserver - Dummies

Nätverksadministration: Licensserver - Dummies

I vissa program kan du köpa nätverkslicenser som gör att du kan installera programvaran på många datorer som du vill, men reglera antalet personer som kan använda programvaran vid en viss tidpunkt. För att styra hur många som använder programvaran, är en särskild licensserver inrättad. När en användare börjar ...