Video: Microsoft BizTalk Server and Microsoft's Middleware vision 2024
Denna figur visar en miljö där data extraheras från tre olika datakällor för att inkluderas i ett datalager och var och en av de tre källorna ligger på en annan plattform. Vid något tillfälle i middleware-processen måste dessa QA'd-extrakt sammanföras för en kombinerad kartläggnings- och transformationsprocess.
Kartläggnings- och transformationstjänsten hanterar klassiska datalagringsproblem. Antag att en datakälla lagrar kunder med hjälp av ett kundnamn med fem tecken och en annan källa använder en sexsiffrig numerisk kundidentifierare.
För att möjliggöra jämförelser och annan datalagerhantering behöver du en gemensam metod för kundidentifiering: Ett av identifieringssystemen måste omvandlas till det andra, eller kanske ett tredje, neutralt identifieringssystem, beroende på miljöens egenskaper.
Förutom hantering av interoperabilitetskompatibiliteter kan ytterligare omvandlingar innefatta
-
Datasammanfattning: En sammanfattning kan utföras tidigare i processen, före rörelseprocessen, beroende på särdrag hos din specifika datalagringsmiljö.
-
Selektiv inkludering av data: Du kan inkludera poster från endast en datakälla, till exempel om du får en jämförbar post från ett annat utdrag. Du vet inte, tills du konvergerar alla datakällans bidrag, hur selektiva inkluderingsregler tillämpas.
-
Datakonvergens: Vissa element från en datakälla kombineras med element från en annan källa för att skapa en enhetlig post för varje kund, produkt, kontrakt eller vilken typ av data du hanterar med.
Den viktigaste punkten att komma ihåg om mappnings- och transformationstjänsten är att du i slutändan ska ha en enhetlig uppsättning data som är redo att ladda in i datalagret - så snart du har gjort några steg.
I komplexa datalagringsmiljöer kanske du vill överväga flera omvandlingsprocesser. Såsom visas i denna figur, konvergeras data extraheringar vid flera olika omvandlingsnivåer innan de flyttas längre ner mellan pipelines med middleware, vilket gör att du kan tillämpa mer hästkrafter på transformationsprocessen genom att använda flera servrar tidigt i flödet.