Video: Enjeux des entrepôts de données de santé 2024
Datalagret är nu under stress och försöker klara av ökade krav på sina ändliga resurser. Hadoop kan ge betydande lättnad i denna datalagringssituation.
Den snabba ökningen av mängden data som genererats i världen har också påverkat datalager, eftersom volymerna av data de hanterar ökar - delvis på grund av mer strukturerad data, vilken typ av data som är starkt skrivet och slits in i rader och kolumner - genereras men också för att du ofta måste ta itu med regelverkskrav som är utformade för att behålla sökbar tillgång till historiska data.
Dessutom används bearbetningseffekten i datalagringshus ofta för att utföra transformationer av relationella data eftersom det antingen går in i lagret eller laddas i en barndata mart (en separat delmängd av datalageret) för en specifik analysapplikation.
Dessutom ökar behovet för analytiker att utfärda nya frågor mot strukturerade data lagrade i lager, och dessa ad hoc-frågor kan ofta använda betydande databehandlingsresurser. Ibland kan en engångsrapport vara tillräcklig, och ibland krävs en undersökande analys för att hitta frågor som inte har ställts in ännu, vilket kan ge betydande affärsvärde.
Utgångspunkten är att datalager ofta används för ändamål bortom deras ursprungliga design.
Figuren visar hur Hadoop kan använda höglagerarkitektur tillsammans med datalager och uppfylla några av de syften som de inte är avsedda för.
Hadoop är ett lager hjälpar, inte ett lagerutbyte. Hadoop kan modernisera ett datalagringsekosystem på fyra sätt. här är de sammanfattande:
-
Ge en landningszon för alla data.
-
Fortsätter data för att ge ett förfrågningsbart arkiv av kalla data.
-
Utnyttja Hadops storskaliga batchbehandlingseffektiviteter för att förprocessera och omvandla data till lageret.
-
Aktivera en miljö för ad hoc-datasökning.