Innehållsförteckning:
Video: Vill du utveckla ditt företag? 2025
Din organisation har överväldigande gynnsamma odds för att ha minst ett sortdatabutik - ett rapporteringssystem som ger informationskapacitet och ibland analytiska möjligheter till en eller flera användargrupper.
Vad är en extraktfil?
Användarna använder förmodligen termen extraktfil för att beskriva denna typ av miljö eftersom den är populär av extrakt av data från produktionssystem, snarare än att användarna tvingas att utföra sina frågor eller få sina rapporter från operativa produktionsdatabaser eller filer. Fortfarande intresserad av att spela oddsen? Här är några fler exempel på typer av datormiljöer som kan beskrivas som sortering av datalager:
-
Även om den extraherade data nästan alltid är inrymd i en enda fil eller databas, kombinerar en sammanslagningsprocess antagligen data från fler än en applikationskälla.
-
Endast valda element, inte alla element från alla tabeller eller filer, från varje datakälla extraheras vanligtvis och kopieras till extraktfilen.
-
En del av datakvalitetssäkringsprocessen går vanligtvis på varje steg i vägen, från det första extraktet för att ladda data till extraktfilen.
-
Vissa strömanvändare kan förmodligen utföra frågor eller skapa statistiska program (till exempel i SAS eller SPSS) mot data, men många användare kommer inte troligen att direkt röra uppgifterna. Istället mottar de förmodligen regelbundet rapporter som genereras antingen automatiskt eller som svar på deras önskemål.
Visst låter som ett datalager, eller hur? Verkligheten är att dessa sortiment av datalagrar typiskt tjänar en mycket liten befolkning och inte är utförda på standard sätt för att stödja företagets bredare behov. Du kan också kalla dem önskvärda datalager.
Här är de flesta organisationernas tillgång till data:
-
Dataanalyser "har inte": Organisationer och individer som har få (och sannolikt ingen) förmåga att göra typen analyser som kan leda till informationsdriven beslutsfattande
-
Dataanalys "haves": Organisationer och individer som kanske inte har ett datalager uppe och går, men gör något med data som de kommer från någonstans. I många fall passar de bara sina affärsbehov.
Varför anses inte utdragsfiler vara datalager?
De är sorts. Extraktfiler, oavsett om de var på 1970-talet, 1980-talet, 1990-talet eller fortfarande används idag, existerar av samma grundläggande skäl att ett fulldatat datalagringshus eller en datormart gör: att tillhandahålla informationsleverans trots en rad olika hinder, såsom hårdvara -för att förstå datastrukturer, "Rör inte produktionssystemets" regler, och bristen på flera-fil eller multi-databas tvärreferens.
Vissa data warehousing förespråkare hävdar att kombinera och omkonfigurera data helt enkelt för att generera rapporter eller att utföra statistisk analys är knappast ett datalag i moderns mening. Extraktfiler är inte utrustade med multidimensionella eller affärsanalysfunktioner, till exempel drill-down och data-svängning.
Om du separerar datalagringssidan (vad som krävs för att samla, flytta och omkonfigurera data från en eller flera källor) från företagsunderrättelsessidan (vad du gör med data efter att du har tillgång till den), bilden blir mycket tydligare.
Extrahera filer, eller vad du vill kalla dem, är väldigt mycket en del av barriärbrytande filosofi för ett datalager. Många av vilka användare som hänvisar till som "extrahera filer" är filbaserade system (i stället för byggda på databaser), och de är nog inte tillräckligt flexibla för att stödja ad hoc-frågande och dimensionell analys. I en verklig mening tjänar dessa miljöer dock syftet med lagring av data för senare användning.
För många användare har affärsanalysfunktioner, till exempel borrning och datasvängning, liten eller ingen användning - åtminstone inte i samband med deras nuvarande jobbdefinitioner. Användarnas jobb kräver funktionalitet som dessa extraheringsfiler kan leverera, såväl som de statiska rapporter och statistisk analys som uppnåtts med den dataen.
Historiens moral: Gå inte in i en organisation som effektivt använder data via extraheringsfiler och redogöra för underlag för datalagring. Istället var försiktig med att föreslå någon datalagringslösning som kan ses som ett steg bakåt. Om du gör den här typen av förslag, har du en lång, ojämn åktur.
