Hem Personliga finanser Egenskaper hos Big Data Analysis - dummies

Egenskaper hos Big Data Analysis - dummies

Video: Nicholas Christakis: How social networks predict epidemics 2024

Video: Nicholas Christakis: How social networks predict epidemics 2024
Anonim

Stor dataanalys har fått mycket hype nyligen och med god anledning. Du måste känna till egenskaperna hos stor dataanalys om du vill vara en del av den här rörelsen. Företag vet att något är där ute, men tills nyligen har det inte kunnat gruva det. Detta trycker på kuvertet på analys är en spännande aspekt av den stora dataanalysrörelsen.

Företagen är glada att kunna komma åt och analysera data som de har samlat in eller vill få insikt från, men har inte kunnat hantera eller analysera effektivt. Det kan innebära att du visualiserar enorma mängder av olika data, eller det kan innebära avancerad analyserad streaming på dig i realtid. Det är evolutionärt i vissa avseenden och revolutionärt i andra.

Så, vad är annorlunda när ditt företag trycker på kuvertet med stor dataanalys? Infrastrukturen som stöder stor dataanalys är annorlunda och algoritmer har ändrats för att vara infrastrukturmedveten.

Stor dataanalys bör ses från två perspektiv:

  • Beslutsriktad

  • Åtgärdsorienterad

Beslutsorienterad analys är mer lik traditionell affärsinformation. Titta på selektiva delmängder och representationer av större datakällor och försök att tillämpa resultaten på processen för att göra affärsbeslut. Visst kan dessa beslut leda till någon form av åtgärd eller processförändring, men syftet med analysen är att öka beslutsfattandet.

Åtgärdsinriktad analys används för snabb respons, när ett mönster kommer fram eller specifika typer av data detekteras och åtgärd krävs. Att dra fördel av stora data genom analys och orsaka proaktiva eller reaktiva beteendeförändringar ger stor potential för tidiga adoptörer.

Hitta och utnyttja stora data genom att skapa analysapplikationer kan hålla nyckeln till att extrahera värde snarare än senare. För att uppnå denna uppgift är det effektivare att bygga dessa anpassade program från början eller genom att utnyttja plattformar och / eller komponenter.

Se först på några av de extra egenskaper som stor dataanalys gör som skiljer sig från traditionella analysformer bortsett från de tre volymerna, hastigheten och variationen:

  • Det kan vara prog. En av de största förändringarna i analysen är att du tidigare handlade med datasatser du manuellt kan ladda in en applikation och utforska. Med stor dataanalys kan du bli utsatt för en situation där du kanske börjar med rådata som ofta måste hanteras programmässigt för att göra någon form av undersökning på grund av omfattningen av data.

  • Det kan vara data driven. Medan många datavetenskapare använder en hypotesdriven metod för dataanalys (utveckla en förutsättning och samla in data för att se om den förutsättningen är korrekt), kan du också använda data för att driva analysen - speciellt om du har samlat enorma mängder av det. Till exempel kan du använda en maskininlärningsalgoritm för att göra denna typ av hypotesfri analys.

  • Det kan använda många attribut på . Tidigare kan du ha hanterat hundratals attribut eller egenskaper hos den datakällan. Nu kan du hantera hundratals gigabyte data som består av tusentals attribut och miljoner observationer. Allt händer nu i större skala.

  • Det kan vara iterativt. Mer beräkningseffekt betyder att du kan iterera på dina modeller tills du får dem hur du vill ha dem. Här är ett exempel. Antag att du bygger en modell som försöker hitta prediktorer för vissa kundbeteenden som är associerade. Du kan börja utvinna ett rimligt urval av data eller ansluta till var data finns. Du kan bygga en modell för att testa en hypotes.

    I det förflutna har du kanske inte haft så mycket minne för att din modell ska fungera effektivt, du behöver en enorm mängd fysiskt minne för att gå igenom de nödvändiga iterationer som krävs för att träna algoritmen. Det kan också vara nödvändigt att använda avancerade datatekniker som naturlig språkbehandling eller neurala nätverk som automatiskt utvecklar modellen baserat på inlärning, eftersom mer data läggs till.

  • Det kan vara snabbt för att få beräkningscyklerna du behöver genom att utnyttja en molnbaserad infrastruktur som en tjänst. Med Infrastructure as a Service (IaaS) -plattformar som Amazon Cloud Services (ACS) kan du snabbt tillhandahålla ett kluster av maskiner för att ta in stora dataset och analysera dem snabbt.

Egenskaper hos Big Data Analysis - dummies

Redaktörens val

Fastighetsprofessionens grunder för fastighetslicensexamen - dummies

Fastighetsprofessionens grunder för fastighetslicensexamen - dummies

Fastighetsexamen kommer att förvänta dig att du har ett grundläggande grepp på fastighetsbranschen. Du tror att det bara är uppenbart att veta vad de viktigaste spelarna gör i en fastighetsaffär, men på grund av den terminologi de delar, blir skillnaderna mellan spelarna lite muddlade. Här är snabba beskrivningar ...

Kostnadsmetoden för fastighetslicensexamen - dummies

Kostnadsmetoden för fastighetslicensexamen - dummies

En metod för att uppskatta Värdet på fastigheter kallas kostnaden. Du måste känna till formeln för fastighetslicensexamen. Kostnadsmetoden baseras på tanken att komponenterna i en fastighet eller marken och byggnaderna kan läggas till för att komma fram till ...

Studie för fastighetslicensexamen - dummies

Studie för fastighetslicensexamen - dummies

När var sista gången du tog en multipelvalsexamen ? Eller, för den delen, någon examen? Det är troligt att det var länge sedan. Kanske överväger du huruvida du ska bli en fastighetsmäklare, men du är lite avskräckt av tanken på att du måste göra ett test. Vad du kan ...

Redaktörens val

Följer ett basketspel på tv - dummies

Följer ett basketspel på tv - dummies

Du kommer bli mycket mer ute av att titta på ett basketspel på TV - eller till och med leva - om du gör mer än att se bollen gå in i rammen. Kolla in dessa insider tips för att fånga den verkliga åtgärden och öka din njutning av sporten. Förutse nästa pass Försök att tänka som ...

Top 5 Fantasy Basketball League Sites - Dummies

Top 5 Fantasy Basketball League Sites - Dummies

Att hitta och gå med på en fantasy basketplats kan ibland vara skrämmande uppgift eftersom så många alternativ är tillgängliga och de flesta webbplatser ser lika ut. Bara för att webbplatser ser ut som det betyder inte nödvändigtvis att de mäter i värde. Vissa webbplatser erbjuder gratis ligor, andra betalade - och vissa webbplatser tillhandahåller bara standard liga ...

Tryck på motståndarna i Basket - Dummies

Tryck på motståndarna i Basket - Dummies

Pressen är kort för tryck. Ofta kallad en fullrättspress, det här är ett anfallande försvar som används på backen, där målet är att tvinga en omsättning. Vanligtvis används efter en gjord korg, svänger pressgruppen över motståndarna i backcourt; Om motståndarna lyckas få bollen förbi halvvägs (kallad brytning ...

Redaktörens val

Hur R beräknar oändliga, odefinierade och saknade värden - dummies

Hur R beräknar oändliga, odefinierade och saknade värden - dummies

Lyckligtvis kan R hantera dataanomalier som förvirrar några andra statistiska plattformar. I vissa fall har du inte reella värden att beräkna med. I de flesta verkliga dataset saknas faktiskt åtminstone några värden. Dessutom har vissa beräkningar oändlighet som ett resultat (som att dividera med noll) eller kan inte ...

Hur man lägger till linjer i en plot i R-dummies

Hur man lägger till linjer i en plot i R-dummies

I R, lägger du till rader i en plott på ett mycket liknande sätt att lägga till poäng, förutom att du använder funktionen linjer () för att uppnå detta. Men använd först lite R magi för att skapa en trendlinje genom data, kallad en regressionsmodell. Du använder lm () -funktionen för att uppskatta en linjär ...

Hur man lägger till en andra dimension i R-dummies

Hur man lägger till en andra dimension i R-dummies

Förutom vektorer kan R representera matriser som ett objekt du arbetar och beräknar med. Faktum är att R verkligen lyser när det gäller matrisberäkningar och -operationer. Vektorer är nära relaterade till en större klass av objekt, arrays. Arrayer har två mycket viktiga egenskaper: De innehåller bara en enda typ av värde. De har ...