Video: Calculation Model (lite version) for Global Management Challenge 2024
Ett datalagringslite är ett otroligt fritt, heltäckande, lågteknologiskt tillvägagångssätt för att tillhandahålla data som kan hjälpa till med några av ditt företags beslutsfattande. No-frills innebär att du, där det är möjligt, sätter samman bevisade funktioner och verktyg som redan finns inom din organisation för att bygga upp ditt system.
Ämnesområden och datainnehåll i ett datalager lite
En datalagerlitteratur är inriktad på rapportering eller analys av endast en eller eventuellt två ämnesområden. Antag att du i ditt jobb vid en trådlös uppdelning av ett telefonselskap analyserar försäljningen av tjänster som nätverksminuter, nätverksminuter, textmeddelanden, Internetåtkomst och annan mobilanvändning till konsumenthushåll.
Om du bygger en datalager lite uteslutande för detta ändamål, har du all nödvändig information för att stödja din analys och rapportering för konsumentmarknaden. Du har dock ingen information om företagsanvändare och betalningshistorik, eftersom den informationen är en del av ett annat ämnesområde, som visas i denna figur.
Baserat på ämnesbegränsning har en datalagerlite bara tillräckligt med datainnehåll för att uppfylla det primära syftet med miljön, men inte tillräckligt för många ostrukturerade scenarier som användarna kan skapa.
Du måste därför noggrant välja bland uppsättningen av alla möjliga dataelement och välja en hanterbar delmängd - element som utan tvekan är viktiga att ha. Denna process är densamma för alla data warehouse implementation, förutom att du måste vara extremt disciplinerad när du fattar beslut om vilket innehåll som ska inkluderas.
Använd standardrapporter, särskilt de som för närvarande kräver mycket manuell förberedelse, som en av dina primära guider för att bestämma datainnehållet i ett datalager lite.
Datakällor
En datalagrings lite har en begränsad uppsättning datakällor - vanligtvis en till en handfull. Som en del av en övergripande miljö med en enda tillämpning fungerar datalagringsliten som omstruktureringsagenten för programmets data för att göra den mer fråge- och rapportvänlig.
Det vanligaste sättet att omstrukturera en enskild applikations data är att deformalisera innehållet i applikationsdatabasdataborden för att eliminera så många relationella anslutningsoperationer (processen att samla data från mer än en databastabell) som möjligt när användarna kör rapporter eller gör enkla frågor.
Denormalisering är motsatsen till relationsdatabasskonceptet för normalisering, en något komplicerad uppsättning riktlinjer som beskriver vilka dataelement som ska finnas i vilka tabeller i en databas.
När du denormaliserar en databas, oroar du dig inte för duplicerade data. du försöker skapa rader med data i ett enda bord som troligtvis speglar rapporter och frågor som användare kör. Den här siffran visar ett exempel på ett enda källkodslager lite byggt på denormalisering.
Även om du kan använda externt angiven data i en datalager-implementering, är de data du använder sällan nyligen förvärvade. Du är mer sannolikt att införliva data som du redan använder för analys (kanske på ett fristående sätt).
Verksamhetsinformationsverktyg
Användarna av ett datalagringsljus ställer vanligtvis frågor och skapar rapporter som speglar ett "Berätta vad som hände" perspektiv. Eftersom dessa användare inte gör mycket tung analytisk bearbetning, bör de produkter de använder för att komma åt datalageret vara lätt för dem att använda.
Datautvinning, rörelse och laddning
Enkelhet är namnet på spelet i ett datalager lite. Gör därför processen med att extrahera data från källor och utföra alla funktioner som behövs för att förbereda den data för laddning så enkelt som möjligt genom att använda dessa två element:
-
Enkla filutdrag ur systemets körsystem och filöverföringar som tillåter dig att flytta data från sina källor till datalagret lite
-
Lättanpassad anpassad kod (eller kanske ett lättanvänt verktyg) som kan extrahera och flytta data
Om datakällan för ditt datalager lite är byggd på en relationsdatabas och du planerar att använda samma databasprodukt för ditt datalager, använd SQL för att enkelt hantera datautvinning och rörelse. Dessa steg - som visas i figuren - ger ett standardförfarande för denna process (du vill naturligtvis skräddarsy dessa steg till din speciella miljö):
-
På det system som hyser ditt lager använder du SQL CREATE TABLE uttalande för att skapa definitionen för varje tabell i ditt datalager lite.
-
Skapa en databas säkerhetskopia som innehåller kopior av alla tabeller från källan som tillhandahåller data till lageret och sedan ladda de här tabellerna till ett mellanrum på systemet där du planerar att hitta ditt datalager.
Du bör se till att nätverksbandbredden och tidsfönstret är tillräckligt för att kopiera alla källtabeller till systemet med hjälp av ett filöverföringsprogram.
-
Använd SQL INSERT-satsen, med ett kapslat SELECT-meddelande som anger källtabellerna och deras respektive kolumner som kommer att fylla i datalagerstabellen (och hur tabellerna kommer att läggas ihop), för att ladda data till din datalagerlite.
-
Kör en serie kvalitetssäkringar (QA) rutiner för att verifiera att alla data har laddats korrekt.
Kontrollera radräkningar, numeriska totalsumma och vad som helst annat du kan.
Arkitektur
Arkitekturen i ett datalagringsliten består av databasen som används för att lagra data, verktygen för affärsinriktning i fronten som används för att få tillgång till data, hur data flyttas och antalet ämnen områden.Urkunden för denna miljö är minimalistisk: inga klockor, inga visselpipor, inget fancy - bara tillräckligt med teknik som tillämpas på miljön för att ge användarna tillgång till data de behöver.
Arkitekturen hos en datalagringslite, som visas i denna figur, innehåller dessa huvudkomponenttyper:
-
En databas innehåller lagrets data.
-
Den databasen matas direkt från var och en av de källor som tillhandahåller data till lageret.
-
Användare får tillgång till data direkt från lagret.