Hem Personliga finanser Hur man visualiserar prediktiv analys Raw data - dummies

Hur man visualiserar prediktiv analys Raw data - dummies

Innehållsförteckning:

Video: Visual Analytics 2025

Video: Visual Analytics 2025
Anonim

En bild är värt tusen ord - speciellt när du försöker få ett bra handtag på din prediktiva analysdata. Vid förbehandlingssteget, medan du förbereder dina data, är det en vanlig praxis att visualisera vad du har till hands innan du fortsätter till nästa steg.

Du börjar med att använda ett kalkylblad som Microsoft Excel för att skapa en datamatris - som består av kandidatdata funktioner (även kallad attribut ). Flera programvarupaket för affärsintelligens (som Tableau) kan ge dig en preliminär översikt över de data som du ska tillämpa analyser på.

Hur man använder tabellvisualiseringar för prediktiv analys

Tabeller är den enklaste, mest grundläggande bildrepresentationen av data. Tabeller (även kända som kalkylblad ) består av rader och kolumner - som motsvarar de objekt och deras attribut som nämns tidigare när de fyller i dina data. Tänk på att titta på online sociala nätverk data. Ett dataobjekt kan representera en användare. Attribut för en användare (dataobjekt) kan vara rubriker i kolumner: Kön, Postnummer eller Födelsedatum.

Cellerna i en tabell representerar värden. Visualisering i tabeller kan hjälpa dig att enkelt upptäcka saknade attributvärden för dataobjekt.

Tabeller kan också ge flexibiliteten att lägga till nya attribut som är kombinationer av andra attribut. Till exempel i sociala nätverk data kan du lägga till en annan kolumn som kallas Ålder, som lätt kan beräknas - som en härledd egenskap - från befintlig födelsedatum. Tabellnätet för sociala nätverk visar en ny kolumn, Ålder, skapad från en annan befintlig kolumn (Födelsedatum).

Streckdiagram används i prediktiv analys

Streckdiagram kan användas för att upptäcka spikar eller anomalier i dina data. Du kan använda den för varje attribut för att snabbt visa minimi- och maximivärden. Streckdiagram kan också användas för att starta en diskussion om hur du normaliserar dina data.

Normalisering är justeringen av värdena för en eller flera attribut på en skala som gör datan mer användbar. Du kan till exempel enkelt se att det finns ett fel i data: Åldersfältet på en post är negativt. Den anomali är lättare avbildad av ett stapeldiagram än av en tabell med data.

Grunderna för cirkeldiagram för prediktiv analys

Kakediagram används huvudsakligen för att visa procentandelar. De kan enkelt illustrera fördelningen av flera objekt och markera den mest dominerande. Råuppgifter för sociala nätverk representeras enligt åldersattributet.Observera att diagrammet inte bara visar en tydlig fördelning av män kontra kvinnor, utan också ett sannolikt fel: R som ett värde för könstyp som eventuellt skapades när data samlades in.

Använda grafdiagram för prediktiv analys

Grafteori tillhandahåller en uppsättning kraftfulla algoritmer som kan analysera data strukturerad och representerad som en graf. I datavetenskap är en graf datastruktur, ett sätt att organisera data som representerar relationer mellan par av dataobjekt. En graf består av två huvuddelar:

  • Vertices, även kända som noder

  • Kantar, som ansluter par noder

Kantar kan riktas (ritas som pilar) och kan ha vikter. Du kan bestämma att placera en kant (pil) mellan två noder (cirklar) - i det här fallet medlemmarna i det sociala nätverket som är anslutna till andra medlemmar som vänner:

Pilens riktning indikerar vem "vänner" som först, eller som initierar interaktioner större delen av tiden.

Begrepp av ordmoln för prediktiv analys

Tänk på en lista med ord eller begrepp som är ordnade som ett ordmoln - en grafisk representation av alla ord i listan, vilket visar storleken på varje ord som proportionellt till en metrik som du anger. Om du till exempel har ett kalkylblad med ord och händelser och du vill identifiera de viktigaste orden, prova ett ordsky.

Word-moln fungerar eftersom de flesta organisationsdata är text; Ett vanligt exempel är Twitter: s användning av trendvillkor. Varje term i denna representation har en vikt som påverkar dess storlek som en indikator på dess relativa betydelse.

Ett sätt att definiera den vikt kan vara hur många gånger ett ord visas i din datainsamling. Ju oftare ett ord visas, den "tyngre" dess vikt - och ju större det visas i molnet.

Hur man använder flockningsfåglar representation för prediktiv analys

Naturligt flockningsbeteende i allmänhet är ett självorganiserande system där föremål (i synnerhet levande saker) tenderar att uppträda enligt (a) den miljö de tillhör och (b) deras svar på andra befintliga objekt. Naturliga samhällenas flockningsbeteende som bin, flugor, fåglar, fisk och myror - eller, för den delen, människor - är också kända som svärm intelligens .

Fåglar följer naturliga regler när de beter sig som en flock. Flockmates är fåglar placerade med ett visst avstånd från varandra; dessa fåglar anses vara likartade. Varje fågel flyttar enligt de tre huvudreglerna som organiserar flockningsbeteende.

  • Separation: Flock-kompisar får inte kollidera med varandra.

  • Anpassning: Flock-kompisar att flytta i samma medelriktning som sina grannar.

  • Sammanhållning: Flockmates flytta sig efter deras flockmates genomsnittliga position eller plats.

Modellering av dessa tre regler kan göra det möjligt för ett analytiskt system att simulera flockningsbeteenden. Med hjälp av det självorganiserade naturliga beteendet hos flockande fåglar kan du konvertera ett rakt kalkylblad till en visualisering.Nyckeln är att definiera begreppet likhet som en del av dina data. Börja med ett par frågor:

  • Vad gör två dataobjekt i dina data liknande?

  • Vilka attribut kan bäst likställa likheten mellan två dataposter?

Exempelvis i datanätdata representerar dataposterna enskilda användare; De attribut som beskriver dem kan innefatta ålder, postnummer, förhållandestatus, lista med vänner, antal vänner, vanor, händelser

Hur man visualiserar prediktiv analys Raw data - dummies

Redaktörens val

Hur man skapar en webbplats i Dreamweaver - dummies

Hur man skapar en webbplats i Dreamweaver - dummies

Definierar en Dreamweaver-webbplats mer smidigt om du har filer du planerar att använda på din webbplats organiserade i en mapp - med, om du vill, undermappar för bilder, video och kanske andra element som ljud. Med dina filer separerade i en organiserad mappstruktur är du redo att definiera en Dreamweaver-webbplats. ...

Hur man skapar en HTML-sida med Dreamweavers nya dokumentfönster - dummies

Hur man skapar en HTML-sida med Dreamweavers nya dokumentfönster - dummies

Du kan skapa en HTML-sida ny HTML-sida genom att använda Dreamweaver's New Document-fönstret, som erbjuder fler alternativ än Välkommen-skärmen, inklusive tillgång till alla mallar du har skapat med Dreamweaver, samt en samling av förutformade layouter, vilket kan ge dig en början på dina design. Du kan skapa många typer av filer ...

Hur man skapar en layout med en kolumn i Dreamweaver - dummies

Hur man skapar en layout med en kolumn i Dreamweaver - dummies

Innan du dyka in för att skapa en komplicerad vätskegriddesign i Dreamweaver, överväg att prova en enklare. Börja med att skapa en enkel vätskegridlayout med en kolumn, följ dessa enkla instruktioner: Välj Arkiv → Nytt. Fönstret Ny dokument öppnas. Obs! Se till att du har slutfört installationsprocessen innan du börjar arbeta med en ny vätska ...

Redaktörens val

Hur man använder Urklippspanel i Excel 2010 - dummies

Hur man använder Urklippspanel i Excel 2010 - dummies

Office Urklipp kan lagra flera nedskärningar och kopior från alla Microsoft Office-program som körs under Windows, inte bara Excel 2010. I Excel betyder det att du kan fortsätta klistra in saker från Office Clipboard i en arbetsbok även efter avslutad flyttning eller kopiering. Använd följande tekniker för att arbeta med ...

Hur man använder referensfunktioner i Excel 2016 - dummies

Hur man använder referensfunktioner i Excel 2016 - dummies

Referensfunktionerna i Excel 2016 på Lookup & Reference Kommandoknappens rullgardinsmeny på Formulas-fliken i bandet är utformad för att specifikt hantera olika aspekter av cellreferenser i arbetsbladet. Denna grupp av funktioner inkluderar: ADRESS för att returnera en cellreferens som en textinmatning i en cell i ...

Hur man använder Sparklines i Excel 2016 - dummies

Hur man använder Sparklines i Excel 2016 - dummies

Excel 2016 stöder en speciell typ av informationsgrafik kallad sparkline som representerar trender eller variationer i samlade data. Sparklines är små grafer i allmänhet om storleken på texten som omger dem. I Excel 2016 är kalkylblad höjden på kalkylbladscellerna, vars data de representerar och kan vara någon av de ...

Redaktörens val

Hur man undviker analysfel på Miller Analogies Test - dummies

Hur man undviker analysfel på Miller Analogies Test - dummies

Miller Analogies Testwriters är bra på att komponera frågor som är subtilt utformade för att lura dig. Du kan undvika vanliga analogfällor på MAT, om du har en plan för attack och en metod för att lösa dem. I allmänhet är den senare frågan i MAT, desto mer sannolikt är det ...

Hur man registrerar sig för MAT (Miller Analogies Test) - dummies

Hur man registrerar sig för MAT (Miller Analogies Test) - dummies

Efter att ha beslutat att ta Miller Analogies Test (MAT), du måste hitta en plats att faktiskt ta provet. Mer än 600 CTC, eller kontrollerade testcenter, administrerar matvaran i hela USA och Kanada, och även utomlands. För att hitta ett testcenter, gå till Miller Analogies Test-webbplatsen och leta efter en ...