Innehållsförteckning:
- Visualisering av dolda grupperingar i dina data
- Visualisering av dataklassificeringsresultat
- Visualisering av utjämnare i dina data
- Visualisering av beslutsträdor
- Visualisering av förutsägelser
Video: Leap Motion SDK 2024
Ofta måste du kunna visa resultaten av din predictive analytics för de som spelar roll. Här är några sätt att använda visualiseringstekniker för att rapportera resultaten av dina modeller till intressenterna.
Visualisering av dolda grupperingar i dina data
Dataklypning är processen att upptäcka dolda grupper av relaterade objekt inom dina data. I de flesta fall består ett kluster (gruppering) av dataobjekt av samma typ som användare av sociala nätverk, textdokument eller e-post. Ett sätt att visualisera resultaten av en dataklyvningsmodell visas nedan, där grafen representerar sociala grupper (kluster) som upptäcktes i data som samlats in från sociala nätverksanvändare.
Uppgifterna om kunder samlades in i tabellformat; då applicerades en klustringsalgoritm på data, och de tre grupperna (grupper) upptäcktes: lojala kunder, vandrande kunder och rabattkunder. Antag att X- och Y-axeln representerar de två huvudkomponenterna som genereras av originaldata. Huvudkomponentanalys (PCA) är en datareduktionsteknik.
Clusteringskunder i tre grupper: lojala, vandrande och rabatt.Här föreslår det visuella förhållandet mellan de tre grupperna redan där förbättrade och riktade marknadsföringsinsatser kan göra det bästa.
Visualisering av dataklassificeringsresultat
En klassificeringsmodell tilldelar en specifik klass till varje ny datapunkt som den undersöker. De specifika klasserna, i det här fallet, kan vara de grupper som härrör från ditt klusterarbete. Utgången markerad i diagrammet kan definiera dina målsatser. För en viss ny kund försöker en prediktiv klassificeringsmodell att förutse vilken grupp den nya kunden kommer att tillhöra.
När du har tillämpat en klustringsalgoritm och upptäckt grupperingar i kunddata kommer du till ett ögonblick av sanningen: Här kommer en ny kund - du vill att modellen ska förutsäga vilken typ av kund han eller hon kommer att vara.
Bilden visar hur en ny kunds information matas till din prediktiva analysmodell, vilket i sin tur förutser vilken kundgrupp den nya kunden tillhör. Nya kunder A, B och C ska tilldelas kluster enligt klassificeringsmodellen. Tillämpning av klassificeringsmodellen resulterade i en förutsägelse att kund A skulle höra till de lojala kunderna, kund B skulle vara en vandrare och kund C visade bara upp för rabatten.
Tilldela kunderna A, B och C, till deras klassificeringar (kluster).Visualisering av utjämnare i dina data
I samband med kluster eller klassificering av nya kunder, råkar du då och då ut i utelämnare (speciella fall som inte passar de befintliga avdelningarna).
Nedan ser du några outliers som inte passar bra in i fördefinierade kluster. Sex outlier kunder har upptäckts och visualiserats. De beter sig på ett tillräckligt sätt så att modellen inte kan avgöra om de tillhör någon av de definierade kategorierna av kunder.
Sex outlier kunder trotsar kategorisering bara genom att dyka upp.Visualisering av beslutsträdor
Många modeller använder beslutsträdor som deras utgångar: Dessa diagram visar de möjliga resultaten från alternativa åtgärdskanaler som läggs ut som grenarna på ett träd.
Bilden nedan visar ett exempel på ett träd som används som klassificerare: Det klassificerar basebollfläktar baserat på några kriterier, främst den mängd som spenderas på biljetter och inköpsdatum. Från denna visualisering kan du förutse vilken typ av fläkt som en ny biljettköpare kommer att vara: casual, lojal, bandwagon, diehard eller någon annan typ.
Egenskaper för varje fläkt nämns på varje nivå i trädet (totalt antal deltagna spel, totalt utnyttjat belopp, årstid); Du kan följa en väg från en viss "rot" till ett specifikt "löv" på trädet, där du träffar en av fläktklasserna (c1, c2, c3, c4, c5).
Hitta den klass där en viss basebollfläkt hör hemma.Antag att du vill bestämma vilken typ av basebollfläkt som en kund är så att du kan bestämma vilken typ av marknadsföringsannonser som ska skickas till kunden. Antag att du hypoteser att baseball fanatiker och bandwagon fans kan övertalas att köpa en ny bil när deras lag går bra och ledde till slutspelet.
Du kanske vill skicka marknadsföringsannonser och rabatter för att övertyga dem om att köpa. Antag dessutom att du antar att bandwagon fans kan övertalas för att rösta till stöd för vissa politiska frågor. Du kan skicka dem marknadsföringsannonser som ber dem om det stödet. Om du vet vilken typ av fläktbas du har kan du med hjälp av beslut hjälpa dig att bestämma hur du ska närma den som en rad olika typer av kunder.
Visualisering av förutsägelser
Antag att du har kört en rad prediktiva analysmodeller, inklusive besluts träd, slumpmässiga skogar och flockningsalgoritmer. Du kan kombinera alla dessa resultat och presentera en konsekvent berättelse som alla stöder. Här är förtroendet en numerisk procentandel som kan beräknas med hjälp av en matematisk funktion. Resultatet av beräkningen inkapslar en poäng av hur sannolikt en möjlig händelse är.
På x-axeln representerar stödmaterialet innehållskällan som analyserades med innehållsanalysmodeller som identifierade de möjliga resultaten. I de flesta fall skulle din prediktiva modell ha behandlat en stor dataset, med hjälp av data från olika källor, för att härleda de möjliga resultaten. Således behöver du visa bara de viktigaste bevisen i din visualisering.
Visar endast de viktigaste stödjande bevisen i visualiseringen.Ovan visas en sammanfattning av resultaten som erhållits genom att använda predictive analytics som en visualisering som illustrerar möjliga resultat, tillsammans med ett förtroendevärde och stödjande bevis för var och en. Tre möjliga scenarier visas:
- Förteckningen över artikel A kommer inte följa efterfrågan om du inte skickar minst 100 enheter varje vecka till Store S. (Förtroende: 98 procent.)
- Antalet försäljningar kommer att öka med 40 procent om du ökar produktionen av punkt A med minst 56 procent. (Confidence score: 83 procent.)
- En marknadsföringskampanj i Kalifornien kommer att öka försäljningen av poster A och D men inte Item K. (Förtroende poäng: 72 procent.)
Förtroende poäng representerar sannolikheten för att varje scenario kommer att hända, enligt din prediktiva analysmodell. Observera att de listas här i fallande sannolikhetsordning.
Här består det viktigaste stödmaterialet av hur utdrag ur flera innehållskällor presenteras över x-axeln. Du kan hänvisa till dem om du behöver förklara hur du kom till ett visst scenario - och prova det bevis som stöder det.
Kraften bakom denna visualisering är dess enkelhet. Tänk dig, efter månader av att använda predictive analytics på dina data, jobba dig igenom flera iterationer, att du går in i ett möte med beslutsfattaren. Du är beväpnad med en bildvisningsbild av tre möjliga scenarier som kan få stor påverkan på verksamheten. En sådan visualisering skapar effektiva diskussioner och kan leda ledningen till "aha" -stunder.