Video: Service Features in the August 2017 2024
Det primära syftet med datautvalet och -xtraktionstjänsten är att välja från (hitta i) en datakälla de data som du vill flytta in i datalagret och sedan extrahera (dra ut) den data till en blankett som kan läsas för kvalitetssäkringstjänster.
Du kan använda en av två olika typer av urval och utvinningstjänster för din datalagringsmiljö:
-
Få dem alla och sortera dem senare: Hitta och extrahera alla dataelement i en källa som du vill ladda in i ditt datalager, oavsett om ett visst element har tidigare extraherats.
-
Ändringsorienterad: Hitta och extrahera endast de dataelement som nyligen har lagts till i datakällan eller uppdaterats sedan den senaste extraktionen.
Den första typen av service kräver mindre komplex logik för att utföra extraktionen. Men du måste hantera större volymer (ibland mycket större volymer) data än med den andra typen, den ändringsorienterade tjänsten.
Den förändringsorienterade metoden för urval och extraktion är ganska enkel när källan är en relationsdatabas som har en tidsstämpel som du kan använda för att upptäcka när en rad data har lagts till eller uppdaterats senast.
Du kan jämföra en rad data mot datum och tid för den sista extraktionsprocessen för att bestämma om data måste väljas och extraheras. Men när data lagras i en fil som inte har en tidsstämpel (en VSAM-fil, till exempel) kan denna process vara betydligt svårare.
Du kan också möta en utmaning när källdata har tagits bort från antingen en fil eller en databas. Om affärsreglerna för din datalagringsmiljö kräver att du slår bort motsvarande data från lagret måste du ha möjlighet att upptäcka borttagningar som gjordes sedan den senaste utvinningsprocessen för att säkerställa att lämpliga borttagningar görs i ditt lager.
Resultatet av urvalet och extraktionen är också ett utdrag av data som är redo att genomgå ytterligare behandling: kontrollera datakvaliteten.