Video: Karolinska Institutet Magisterutbildning i demensvård 2024
Många företag utforskar stora dataproblem och kommer fram med några innovativa lösningar. Nu är det dags att uppmärksamma några bästa praxis, eller grundläggande principer, som kommer att hjälpa dig bra när du börjar din stora datatur.
I själva verket passar stor dataintegration i den övergripande processen att integrera data över hela företaget. Därför kan du inte bara slänga bort allt du har lärt dig från datainintegration av traditionella datakällor. Samma regler gäller om du tänker på traditionell datahantering eller stor datahantering.
Håll dessa nyckelproblem högst upp i din prioritetslista för stor dataintegration:
-
Håll datakvaliteten i perspektiv. Din betoning på datakvalitet beror på scenen i din stora dataanalys. Förvänta dig inte att kunna styra datakvaliteten när du gör din första analys på stora datamängder. Men när du begränsar dina stora data för att identifiera en delmängd som är mest meningsfull för din organisation, är det här när du behöver fokusera på datakvalitet.
I slutändan blir datakvaliteten viktig om du vill att dina resultat ska förstås i sammanhang med dina historiska data. Eftersom ditt företag bygger mer och mer på analytics som ett nyckelplaneringsverktyg kan datakvalitet betyda skillnaden mellan framgång och misslyckande.
-
Tänk på datakrav i realtid. Stora data kommer att medföra strömmande data i framkant. Därför måste du ha en klar förståelse för hur du integrerar data i rörelse i din miljö för förutsägbar analys.
-
Skapa inte nya silor av information. Medan så mycket av betoningen kring stora data är inriktad på Hadoop och andra ostrukturerade och halvstrukturerade källor, kom ihåg att du måste hantera dessa data i sammanhang med verksamheten. Du måste därför integrera dessa källor med din affärsinformation och ditt datalager.