Hem Personliga finanser Stor dataanalys och data warehouse dummies

Stor dataanalys och data warehouse dummies

Innehållsförteckning:

Video: ExarbLSKvantitativ_HD.mp4 2025

Video: ExarbLSKvantitativ_HD.mp4 2025
Anonim

Du kommer att hitta värde för att samla dataagasins kapacitet och den stora datamiljön. Du måste skapa en hybridmiljö där stora data kan fungera hand i hand med datalageret.

Först är det viktigt att erkänna att datalageret som det är utformat idag inte kommer att förändras på kort sikt.

Därför är det mer pragmatiskt att använda datalagret för vad det har utformats för att göra - ge en välbevakad version av sanningen om ett ämne som verksamheten vill analysera. Lageret kan innehålla information om ett visst företags produktlinje, dess kunder, dess leverantörer och uppgifter om ett års värde av transaktioner.

Den information som hanteras i datalagret eller en avdelningsdata mart har konstruerats noga så att metadata är korrekt. Med tillväxten av ny webbaserad information är det praktiskt och ofta nödvändigt att analysera denna enorma mängd data i sammanhang med historiska data. Det är här hybridmodellen kommer in.

Vissa aspekter av att gifta datalagret med stora data kan vara relativt enkla. Till exempel kommer många av de stora datakällorna från källor som innehåller egna väldesignade metadata. Komplexa e-handelswebbplatser innehåller väldefinierade dataelement. Därför arbetar informationshanteringsorganisationen vid analys mellan lageret och den stora datakällan med två datasatser med noggrant utformade metadatamodeller som måste rationaliseras.

Naturligtvis saknar informationskällorna i vissa situationer explicit metadata. Innan en analytiker kan kombinera de historiska transaktionsdata med mindre strukturerade stora data måste arbetet göras. Vanligtvis kommer initial analys av dataöverföringar att avslöja intressanta mönster som kan hjälpa till att förutsäga subtila förändringar i affärsverksamhet eller potentiella lösningar för patientens diagnos.

Den inledande analysen kan kompletteras med hjälp av verktyg som MapReduce med Hadoop distribuerade filsystemet. Vid denna tidpunkt kan du börja förstå om den kan hjälpa till att utvärdera problemet som behandlas.

I analysprocessen är det lika viktigt att eliminera onödiga data som det är att identifiera data som är relevanta för företagskontexten. När denna fas är klar måste de återstående data transformeras så att metadatadefinitioner är exakta. På det sättet, när de stora data kombineras med traditionell historisk data från lageret, kommer resultaten att vara exakta och meningsfulla.

Den stora dataintegrationen Lynchpin

Denna process kräver en väldefinierad dataintegrationsstrategi. Medan dataintegration är ett kritiskt inslag i hanteringen av stor data är det lika viktigt när man skapar en hybridanalys med datalagret. Faktum är att processen med att extrahera data och omvandla den i en hybridmiljö, liknar hur den här processen utförs inom ett traditionellt datalager.

I datalagret extraheras data från traditionella källsystem, såsom CRM eller ERP-system. Det är kritiskt att element från dessa olika system är korrekt matchade.

Rethink-extraktion, transformation och laster för datalager

I datalagret hittar du ofta en kombination av relationsdatabastabeller, platta filer och icke-relationella källor. Ett välbyggt datalager kommer att byggas så att data konverteras till ett gemensamt format, vilket gör att frågor kan behandlas exakt och konsekvent. De extraherade filerna måste omvandlas för att matcha affärsreglerna och processerna i ämnesområdet som datalageret är utformat för att analysera.

Med andra ord måste uppgifterna extraheras från de stora datakällorna, så att dessa källor kan fungera på ett säkert sätt och ge meningsfulla resultat. Dessutom måste källorna transformeras så att de är användbara vid analys av relationen mellan de historiska data och de mer dynamiska och realtidsdata som kommer från stora datakällor.

Laddar information i den stora datamodellen kommer att vara annorlunda än vad du kan förvänta dig i ett traditionellt datalager. Med datalager, efter att data har kodifierats ändras det aldrig. Ett typiskt datalager ger verksamheten en ögonblicksbild av data baserat på behovet av att analysera en viss affärsproblem som kräver övervakning, såsom lager eller försäljning.

Den distribuerade strukturen hos stora data leder ofta till att organisationerna först laddar data i en serie noder och sedan utträder och transformeras. När man skapar en hybrid av det traditionella datalageret och den stora datamiljön kan den stora datormiljöens distribuerade natur dramatiskt förändra organisationernas förmåga att analysera stora datamängder i samband med verksamheten.

Stor dataanalys och data warehouse dummies

Redaktörens val

Vad är en Java-karta? - dummies

Vad är en Java-karta? - dummies

Arrays och specialiserade listor gör det möjligt att utföra en fantastisk uppsättning uppgifter med Java. Det finns dock situationer där en Java-applikation behöver något som är mer relaterat till en databas, utan att egentligen ha allt databasbagage (som att behöva köpa en separat applikation). Till exempel kanske du vill kunna ...

Några få saker om Java Math - dummies

Några få saker om Java Math - dummies

Tro det eller inte, datorer - även de mest kraftfulla - Ha vissa begränsningar när det gäller att utföra matematiska beräkningar. Dessa begränsningar är vanligtvis obetydliga, men ibland slår de sig och biter på dig. Här är de saker du behöver se upp för när du gör matte i Java. Helhetsflöde Det grundläggande problemet ...

Vad är recursion i Java Programmering? - dummies

Vad är recursion i Java Programmering? - dummies

Rekursion är en grundläggande programmeringsteknik som du kan använda i Java, där en metod kallar sig för att lösa ett problem. En metod som använder denna teknik är rekursiv. Många programmeringsproblem kan lösas endast genom rekursion, och vissa problem som kan lösas med andra tekniker löses bättre genom rekursion. En av ...

Redaktörens val

4 Måste-inkludera i din blogg sidobardesign - dummies

4 Måste-inkludera i din blogg sidobardesign - dummies

Din bloggens sidofält är viktig fastighet som bör innehålla de element du vill ha mest. När du utformar din blogg sidofält kan du dra från en nästan oändlig lista över sidospårelement. Genom att välja noggrant vad som ska inkluderas (och vad som inte ska inkluderas) kan du ställa in din blogg från andra.

5 Användbara Wordpress Plugins - dummies

5 Användbara Wordpress Plugins - dummies

Om du bloggar på en självhävd plattform med WordPress-programvara, är det dags att anpassa din blogg med plug-ins - programvara som kan "anslutas" till din befintliga WordPress bloggprogramvara. Plug-ins gör det möjligt för dig att göra allt från funktionsbildspel i dina blogginlägg för att ansluta sociala medier till din webbplats. Här är fem användbara ...

7 Sätt att erövra Writer's Block som en Blogger - dummies

7 Sätt att erövra Writer's Block som en Blogger - dummies

Varje bloggare möter författarens block i ett tid eller annan. Om du är den typ av bloggare som sköter innehåll varje dag, kan författarens block vara stäverande. Kan du inte ta en paus för att få ditt skrivande mojo tillbaka? Prova en (eller flera) av dessa sju sätt att slå författarens block för att få dig tillbaka ...

Redaktörens val

10 Stora elektronikkomponentkällor - dummies

10 Stora elektronikkomponentkällor - dummies

Letar du efter några bra källor till dina elektroniska delar? Denna lista ger dig några fleråriga favoriter, både inom och utanför Nordamerika. Denna lista är inte uttömmande. Du hittar bokstavligen tusentals specialutbud för ny och begagnad elektronik. Plus, Amazon och eBay ger virtuella marknadsplatser för alla sorters säljare - ...

Elektronik Basics: Resistance - dummies

Elektronik Basics: Resistance - dummies

I elektronikvärlden är motståndet inte meningslöst. Faktum är att motstånd kan vara mycket användbart. Utan motstånd skulle elektronik inte vara möjligt. Elektronik handlar om att manipulera strömmen av ström, och ett av de mest grundläggande sätten att manipulera strömmen är att minska det genom resistans. Utan motstånd strömmar strömmen oreglerad och där ...

Digital elektronik: Så här installerar du BASIC Stamp Editor och Anslut till Stämpeldummorna

Digital elektronik: Så här installerar du BASIC Stamp Editor och Anslut till Stämpeldummorna

För att berätta för BASIC Stamp vad du vill göra i ditt digitala elektronikprojekt måste du programmera det. BASIC Stamp Windows Editor är den programvara som du använder på din dator för att skapa program som kan laddas ner till en BASIC Stamp-mikrokontroller. Denna programvara är tillgänglig gratis från Parallax webbplats. ...