Video: 05 SQL Server 2016 Enterprise Information Management (EIM) 2025
Omkring 1995 började säljare att placera sin programvara som virtuella datalagringsverktyg. Den grundläggande förutsättningen var att ibland är det inte meningsfullt att kopiera och manipulera en massa data, bara om någon behöver det. Varför inte tillgång till data direkt från källan vid behov?
Tyvärr har tillgång till data över ett nätverk vid källan visat sig vara minst utmanande för problemen när det gäller att försöka tillhandahålla en slags inbyggd datalagring. Samma utmaningar som står inför varje datalagringsmiljö (som att hantera datakvalitet, bestämma vilka typer av omvandlingar som ska ske och välja hur man hanterar dessa omvandlingar när olika källor är inkonsekventa) finns fortfarande.
Bara för att du kan hämta data vid källan (i nästan vilken databas eller filstruktur) betyder det inte att data ger den nödvändiga affärsinformationen när den är i dina händer.
För att lösa dessa datakvalitetsproblem har många datarkarkister börjat utföra bottom-up data mart-konstruktion för att utveckla ett komponentbaserat datalager. I stället för att ha en enda databas, där du matar in alla data (skapar ditt datalager), hanterar en serie komponenter varje enskild uppsättning funktioner (till exempel svar på specifika affärsproblem) eller vissa ämnen. Tillsammans utgör dessa data mars (eller komponenter) en datalagringsmiljö.
Denna komponentbaserade, dynamiska åtkomstdataarkitektur utgör grunden för virtuell datalagring och, mer specifikt, vilka Enterprise Information Integration (EII) servrar som erbjuds till marknaden.
Denna figur visar en miljö där enskilda komponenter skapas inom datalagringsmiljön i botten upp. Istället för att kombinera komponenterna i en stor databas (och kopiera all data igen) skapar EII en datalagringsmiljö där användare kan komma åt varje komponents innehåll från ett företagsintelligensverktyg som de alla lagras tillsammans, även om de inte är.
Tänk på hur du använder en webbläsare på skrivbordet. Du klickar antingen på en länk eller skriver in en specifik webbadress, och miljön som arbetar bakom kulisserna tar dig till rätt plats för innehållet du bad om. Tänk nu att Internet körs mycket snabbare.
När du går till olika platser får du inte tillgång till annonser för den senaste fyrhjulsdriften du har spelat, sportresultat, Dilbert-tecknade filmer eller vad som helst du gör på Internet.Du tar tillbaka data som sedan kombineras och skickas tillbaka till din webbläsare. Det är virtuell datalagring - det är precis som Internet!
Det är inte en bra idé att bygga en virtuell datalagringsmiljö för att få tillgång till källdata direkt i sitt ursprungliga format. Din utmaning är inte att bestämma hur du går med i datortransformatordatabaser (t.ex. kombinering av IMS-data med DB2-data) och hantering av dessa typer av omvandlingar på systemnivå, det säkerställer att kvaliteten på data är hög och inte kräver användaren för att manuellt rengöra data.
Varje ansökan bör därför vara lageraktiverad och innehålla en datalagare som ansvarar för alla middleware-tjänster (t.ex. utvinning och kvalitetssäkring), som anges i miljöens affärsregler.
Dataförlaget skulle kunna tänka sig fungera nästan i realtidsläget, som det skulle behöva göra i en operativ datalagring, eller det kan fungera i ett periodiskt (batch-orienterat) läge om momentan uppdateringar inte behövs. I denna situation är datautgivaren en mini-middleware-produkt inbäddad i programmet (eller en tjänst som åtkomst till programmet).
När du tänker på virtuell datalagring, ersätt frågan "Kan jag komma till data? "Med frågan" Kan jag komma till användbar data? "Dataförlaget spelar en viktig roll och bör inte försummas.
Du kan inte heller försumma datarkitektur. Bara för att du utvecklar komponenter på botten upp och de öppnas på plats, istället för att kopieras till en större datalagerdatabas, betyder inte att du kan försumma denna funktion.
Säg att en komponent lagrar kund-ID som femsiffriga nummer efter att transformationen inträffat och innehåller endast kunder som köpte under de senaste sex månaderna. Och en annan komponent, som innehåller alla kunder som någonsin har köpt ditt företags produkter, använder sju bokstäver alfanumeriska identifierare. I det här fallet kan du ha samma typ av felmatchningsproblem som du skulle om du skulle få tillgång till data direkt från källorna.
Även om EII tillåter skillnader mellan komponentinnehåll måste du förstå och hantera skillnaderna så att du inte hindrar affärsintelligensuppdraget.
