Innehållsförteckning:
- Känna sannolikheten för att en händelse kommer att inträffa
- Tillämpa varians för att visa omfattningen av förändringen
- Förutspår framtiden
Video: How I hacked online dating | Amy Webb 2024
Ordet statistik kan framkalla rädsla hos vissa nybörjare i datavisualisering, men om du ignorerar det här ämnet, förbiser du en av de mest kraftfulla sätt att härleda sann insikt och värde från Big Data.
Statistik är övningen eller vetenskapen om att samla in numeriska data i stora mängder. Du behöver inte gå ut och bli en datavetenskapare (en term som används för statistiker som också är data geeks i förklädnad och som vanligtvis håller någon typ av avancerad examen, till exempel en doktorand), men du kanske vill överväga att plocka upp en statistik 101 bok eller klass om du har något intresse.
Statistiska formler som sannolikhet, varians och prognos är populära idag. De är ganska lätta att tillämpa på en dataset, och de flesta läsare förstår dem tydligt. Du kan införliva några av dessa statistiska formler i dina Big Data-visualiseringar för att ge äkta värde till användarna genom att använda de tekniker som diskuteras i följande avsnitt.
Känna sannolikheten för att en händelse kommer att inträffa
En statistisk formel som du kanske känner till är p robability - sannolikheten eller chansen att en händelse kan inträffa. Följande formel beräknar grundläggande sannolikhet för ett linjärt scenario. (Nonlinear scenarier är lite komplexa och för mycket av ett företag för en nybörjare.)
Sannolikhet = Sannolikhet En händelse kommer att inträffa / Antal möjliga resultat
Följande bild visar en sannolikhet med några varningsfärger som läggs till för att göra meddelande lätt att läsa och viktigast att tydligt ange att omedelbar åtgärd behövs.
Sannolikheter ger en snabb verklighetskontroll och ställer in den övergripande tonen för berättelsen som datavisualiseringen kommer att ge under en given period (dag, vecka, kvartal osv.).
Tillämpa varians för att visa omfattningen av förändringen
En annan populär statistisk åtgärd är v ariance , som är skillnaden mellan en uppsättning datapunkter.
Den vanligaste formeln för beräkning av variansen är
Varians = Slutlig önskad - Aktuell status
Om den visade effekten är ett heltal eller procenttal, visar formeln storleken på ändringen mellan början och slutändan av en datapunkt.
Visa variansen är alltid en snabb vinst och en bra ersättare för linjekortet / linjekartan, vilket är hur variansförhållandet visas i de flesta visualiseringar.
Diagrammet i nedanstående figur visar en kombinationslinje för linje / streckdiagram som låter användaren dechifiera variansen för varje månad.
Det andra diagrammet, som visas i följande figur, tydligt avgränsar variansen och tar allt gissningen ut ur det visuella.
Förutspår framtiden
En annan populär statistisk formel som du kanske känner till är f orecast , som är en förutsättning att förutsäga eller uppskatta en händelse eller trend.
När du beräknar en prognos använder du verkligen en viss mängd historiska data för att förutsäga beteende, en viss händelse eller en trend. Till exempel kan du beräkna årets försäljning baserat på det historiska faktumet att januari vanligtvis står för 5% av försäljningen. Om du gjorde $ 500 i försäljningen i januari skulle du använda följande formel för att prognostisera hur mycket försäljning du kan förvänta dig för året:
$ 500 /. 05 = $ 10 000
I denna ekvation är $ 500 försäljningen i januari;. 05 är den historiska procentsatsen av försäljningen som januari står för; och $ 10 000 är den beräknade försäljningen för året.
Figuren nedan visar hur prognoser visas i de flesta datavisualiseringar som en enkel linje i ett diagram. Prognoser visar hur en viss aktivitet kan utföra i framtiden.
Denna typiska visning av en prognoslinje visar att kassaflödet så småningom blir ett problem för den här organisationen.