Hem Personliga finanser Hur man visualiserar prediktiv analys Raw data - dummies

Hur man visualiserar prediktiv analys Raw data - dummies

Innehållsförteckning:

Video: Visual Analytics 2024

Video: Visual Analytics 2024
Anonim

En bild är värt tusen ord - speciellt när du försöker få ett bra handtag på din prediktiva analysdata. Vid förbehandlingssteget, medan du förbereder dina data, är det en vanlig praxis att visualisera vad du har till hands innan du fortsätter till nästa steg.

Du börjar med att använda ett kalkylblad som Microsoft Excel för att skapa en datamatris - som består av kandidatdata funktioner (även kallad attribut ). Flera programvarupaket för affärsintelligens (som Tableau) kan ge dig en preliminär översikt över de data som du ska tillämpa analyser på.

Hur man använder tabellvisualiseringar för prediktiv analys

Tabeller är den enklaste, mest grundläggande bildrepresentationen av data. Tabeller (även kända som kalkylblad ) består av rader och kolumner - som motsvarar de objekt och deras attribut som nämns tidigare när de fyller i dina data. Tänk på att titta på online sociala nätverk data. Ett dataobjekt kan representera en användare. Attribut för en användare (dataobjekt) kan vara rubriker i kolumner: Kön, Postnummer eller Födelsedatum.

Cellerna i en tabell representerar värden. Visualisering i tabeller kan hjälpa dig att enkelt upptäcka saknade attributvärden för dataobjekt.

Tabeller kan också ge flexibiliteten att lägga till nya attribut som är kombinationer av andra attribut. Till exempel i sociala nätverk data kan du lägga till en annan kolumn som kallas Ålder, som lätt kan beräknas - som en härledd egenskap - från befintlig födelsedatum. Tabellnätet för sociala nätverk visar en ny kolumn, Ålder, skapad från en annan befintlig kolumn (Födelsedatum).

Streckdiagram används i prediktiv analys

Streckdiagram kan användas för att upptäcka spikar eller anomalier i dina data. Du kan använda den för varje attribut för att snabbt visa minimi- och maximivärden. Streckdiagram kan också användas för att starta en diskussion om hur du normaliserar dina data.

Normalisering är justeringen av värdena för en eller flera attribut på en skala som gör datan mer användbar. Du kan till exempel enkelt se att det finns ett fel i data: Åldersfältet på en post är negativt. Den anomali är lättare avbildad av ett stapeldiagram än av en tabell med data.

Grunderna för cirkeldiagram för prediktiv analys

Kakediagram används huvudsakligen för att visa procentandelar. De kan enkelt illustrera fördelningen av flera objekt och markera den mest dominerande. Råuppgifter för sociala nätverk representeras enligt åldersattributet.Observera att diagrammet inte bara visar en tydlig fördelning av män kontra kvinnor, utan också ett sannolikt fel: R som ett värde för könstyp som eventuellt skapades när data samlades in.

Använda grafdiagram för prediktiv analys

Grafteori tillhandahåller en uppsättning kraftfulla algoritmer som kan analysera data strukturerad och representerad som en graf. I datavetenskap är en graf datastruktur, ett sätt att organisera data som representerar relationer mellan par av dataobjekt. En graf består av två huvuddelar:

  • Vertices, även kända som noder

  • Kantar, som ansluter par noder

Kantar kan riktas (ritas som pilar) och kan ha vikter. Du kan bestämma att placera en kant (pil) mellan två noder (cirklar) - i det här fallet medlemmarna i det sociala nätverket som är anslutna till andra medlemmar som vänner:

Pilens riktning indikerar vem "vänner" som först, eller som initierar interaktioner större delen av tiden.

Begrepp av ordmoln för prediktiv analys

Tänk på en lista med ord eller begrepp som är ordnade som ett ordmoln - en grafisk representation av alla ord i listan, vilket visar storleken på varje ord som proportionellt till en metrik som du anger. Om du till exempel har ett kalkylblad med ord och händelser och du vill identifiera de viktigaste orden, prova ett ordsky.

Word-moln fungerar eftersom de flesta organisationsdata är text; Ett vanligt exempel är Twitter: s användning av trendvillkor. Varje term i denna representation har en vikt som påverkar dess storlek som en indikator på dess relativa betydelse.

Ett sätt att definiera den vikt kan vara hur många gånger ett ord visas i din datainsamling. Ju oftare ett ord visas, den "tyngre" dess vikt - och ju större det visas i molnet.

Hur man använder flockningsfåglar representation för prediktiv analys

Naturligt flockningsbeteende i allmänhet är ett självorganiserande system där föremål (i synnerhet levande saker) tenderar att uppträda enligt (a) den miljö de tillhör och (b) deras svar på andra befintliga objekt. Naturliga samhällenas flockningsbeteende som bin, flugor, fåglar, fisk och myror - eller, för den delen, människor - är också kända som svärm intelligens .

Fåglar följer naturliga regler när de beter sig som en flock. Flockmates är fåglar placerade med ett visst avstånd från varandra; dessa fåglar anses vara likartade. Varje fågel flyttar enligt de tre huvudreglerna som organiserar flockningsbeteende.

  • Separation: Flock-kompisar får inte kollidera med varandra.

  • Anpassning: Flock-kompisar att flytta i samma medelriktning som sina grannar.

  • Sammanhållning: Flockmates flytta sig efter deras flockmates genomsnittliga position eller plats.

Modellering av dessa tre regler kan göra det möjligt för ett analytiskt system att simulera flockningsbeteenden. Med hjälp av det självorganiserade naturliga beteendet hos flockande fåglar kan du konvertera ett rakt kalkylblad till en visualisering.Nyckeln är att definiera begreppet likhet som en del av dina data. Börja med ett par frågor:

  • Vad gör två dataobjekt i dina data liknande?

  • Vilka attribut kan bäst likställa likheten mellan två dataposter?

Exempelvis i datanätdata representerar dataposterna enskilda användare; De attribut som beskriver dem kan innefatta ålder, postnummer, förhållandestatus, lista med vänner, antal vänner, vanor, händelser

Hur man visualiserar prediktiv analys Raw data - dummies

Redaktörens val

Fastighetsprofessionens grunder för fastighetslicensexamen - dummies

Fastighetsprofessionens grunder för fastighetslicensexamen - dummies

Fastighetsexamen kommer att förvänta dig att du har ett grundläggande grepp på fastighetsbranschen. Du tror att det bara är uppenbart att veta vad de viktigaste spelarna gör i en fastighetsaffär, men på grund av den terminologi de delar, blir skillnaderna mellan spelarna lite muddlade. Här är snabba beskrivningar ...

Kostnadsmetoden för fastighetslicensexamen - dummies

Kostnadsmetoden för fastighetslicensexamen - dummies

En metod för att uppskatta Värdet på fastigheter kallas kostnaden. Du måste känna till formeln för fastighetslicensexamen. Kostnadsmetoden baseras på tanken att komponenterna i en fastighet eller marken och byggnaderna kan läggas till för att komma fram till ...

Studie för fastighetslicensexamen - dummies

Studie för fastighetslicensexamen - dummies

När var sista gången du tog en multipelvalsexamen ? Eller, för den delen, någon examen? Det är troligt att det var länge sedan. Kanske överväger du huruvida du ska bli en fastighetsmäklare, men du är lite avskräckt av tanken på att du måste göra ett test. Vad du kan ...

Redaktörens val

Följer ett basketspel på tv - dummies

Följer ett basketspel på tv - dummies

Du kommer bli mycket mer ute av att titta på ett basketspel på TV - eller till och med leva - om du gör mer än att se bollen gå in i rammen. Kolla in dessa insider tips för att fånga den verkliga åtgärden och öka din njutning av sporten. Förutse nästa pass Försök att tänka som ...

Top 5 Fantasy Basketball League Sites - Dummies

Top 5 Fantasy Basketball League Sites - Dummies

Att hitta och gå med på en fantasy basketplats kan ibland vara skrämmande uppgift eftersom så många alternativ är tillgängliga och de flesta webbplatser ser lika ut. Bara för att webbplatser ser ut som det betyder inte nödvändigtvis att de mäter i värde. Vissa webbplatser erbjuder gratis ligor, andra betalade - och vissa webbplatser tillhandahåller bara standard liga ...

Tryck på motståndarna i Basket - Dummies

Tryck på motståndarna i Basket - Dummies

Pressen är kort för tryck. Ofta kallad en fullrättspress, det här är ett anfallande försvar som används på backen, där målet är att tvinga en omsättning. Vanligtvis används efter en gjord korg, svänger pressgruppen över motståndarna i backcourt; Om motståndarna lyckas få bollen förbi halvvägs (kallad brytning ...

Redaktörens val

Hur R beräknar oändliga, odefinierade och saknade värden - dummies

Hur R beräknar oändliga, odefinierade och saknade värden - dummies

Lyckligtvis kan R hantera dataanomalier som förvirrar några andra statistiska plattformar. I vissa fall har du inte reella värden att beräkna med. I de flesta verkliga dataset saknas faktiskt åtminstone några värden. Dessutom har vissa beräkningar oändlighet som ett resultat (som att dividera med noll) eller kan inte ...

Hur man lägger till linjer i en plot i R-dummies

Hur man lägger till linjer i en plot i R-dummies

I R, lägger du till rader i en plott på ett mycket liknande sätt att lägga till poäng, förutom att du använder funktionen linjer () för att uppnå detta. Men använd först lite R magi för att skapa en trendlinje genom data, kallad en regressionsmodell. Du använder lm () -funktionen för att uppskatta en linjär ...

Hur man lägger till en andra dimension i R-dummies

Hur man lägger till en andra dimension i R-dummies

Förutom vektorer kan R representera matriser som ett objekt du arbetar och beräknar med. Faktum är att R verkligen lyser när det gäller matrisberäkningar och -operationer. Vektorer är nära relaterade till en större klass av objekt, arrays. Arrayer har två mycket viktiga egenskaper: De innehåller bara en enda typ av värde. De har ...