Video: Frågor och svar om GDPR 2024
En del av Big Data For Dummies Cheat Sheet
Ostrukturerad data skiljer sig från strukturerade data eftersom dess strukturen är oförutsägbar. Exempel på ostrukturerad data är dokument, e-post, bloggar, digitala bilder, videor och satellitbilder. Det innehåller också vissa data som genereras av maskiner eller sensorer. Faktum är att ostrukturerad data står för de flesta data som finns på företagets lokaler såväl som externt för ditt företag i privata privata och offentliga källor, som Twitter och Facebook.
Tidigare kunde de flesta företag varken fånga eller lagra denna stora mängd data. Det var helt enkelt för dyrt eller för överväldigande. Även om företag kunde fånga upp data hade de inte verktygen för att enkelt analysera data och använda resultaten för att fatta beslut. Mycket få verktyg kan ge mening om dessa stora mängder data. De verktyg som existerade var komplexa att använda och gav inte resultat i en rimlig tidsram.
I slutändan tvingades de som verkligen ville gå till den enorma ansträngningen att analysera dessa data tvingas arbeta med snapshots av data. Detta har den oönskade effekten av att sakna viktiga händelser eftersom de inte befann sig i en viss ögonblicksbild.
En metod som blir alltmer värderad som ett sätt att få affärsvärde från ostrukturerad data är textanalys, processen för att analysera ostrukturerad text, extrahera relevant information och omvandla den till strukturerad information som då kan fångas på olika sätt. Analys- och extraktionsprocesserna utnyttjar tekniker som härstammar i beräkningslingvistik, statistik och andra datavetenskapsdiscipliner.