Innehållsförteckning:
- Hur man beskriver gränserna för den prediktiva analysmodellen
- Ingen modell kan producera 100 procent noggranna prognoser. Varje modell har potential att producera felaktiga resultat. Var på utkik efter någon signifikant variation mellan prognoserna som din modell producerar och de observerade dataen - speciellt om modellens utgångar motverkar sunt förnuft.Om det ser för bra ut, dåligt eller extremt för att vara sant, är det förmodligen inte sant (i verkligheten, ändå).
- När du bygger en modell, behåll alltid skalbarhet i åtanke. Kontrollera alltid prestanda, noggrannhet och tillförlitlighet hos modellen i olika vågar. Din modell ska kunna ändra sin skala - och skala upp så stor som nödvändigt - utan att falla ihop eller utföra dåliga förutsägelser.
Video: Hur skall vi adressera problemet, när nästan ingen vet vad problemet är? 2024
Prediktiv modellering blir popularitet som ett verktyg för att hantera många aspekter av verksamheten. Att säkerställa att dataanalys görs rätt ökar förtroendet för de anställda modellerna, vilket i sin tur kan generera den nödvändiga inköpet för prediktiv analys att bli en del av din organisations standardverktyg.
Den här ökande populariteten kommer kanske att bero på hur ett predictive analytics-projekt kan stödja beslutsfattandet genom att skapa modeller som beskriver dataset, upptäcka möjliga nya mönster och trender (som indikeras av data) och förutse resultat med större tillförlitlighet.
För att uppnå detta mål måste ett prediktivt analysprojekt leverera en modell som bäst passar data genom att välja beslutsvariablerna korrekt och effektivt. Vissa avgörande frågor måste besvaras på vägen mot det målet:
-
Vilka är minsta antaganden och beslutsvariabler som gör det möjligt för modellen att bäst passa data?
-
Hur jämför modellen under konstruktion med andra tillämpliga modeller?
-
Vilka kriterier är bäst för att utvärdera och värdera denna modell?
Återigen kan du ringa erfarenhetens röst till räddning: Domänkunskapsexperter kan diskutera dessa frågor, tolka eventuella resultat som visar dolda mönster i data och hjälpa till att verifiera och validera modellens utdata.
Hur man beskriver gränserna för den prediktiva analysmodellen
En eventuell prediktiv analysmodell har vissa begränsningar baserade på de algoritmer som den använder och den dataset den körs på. Du bör vara medveten om dessa begränsningar och få dem att fungera till din fördel. de som är relaterade till algoritmerna inkluderar
Hur mycket korrelerade variablerna är (statistiska samband mellan funktioner)
Om variablerna är oberoende (inga relationer mellan funktionerna)
Om omfattningen av provdata gör modellen svår att överföras
För att övervinna begränsningarna i din modell, använd ljud
cross validation tekniker för att testa dina modeller. Börja med att dela dina data i träning och testa dataset, och kör modellen mot var och en av dessa datasatser separat för att utvärdera och räkna modellens förutsägelser. Så här testar du och utvärderar din prediktiva analysmodell
Ingen modell kan producera 100 procent noggranna prognoser. Varje modell har potential att producera felaktiga resultat. Var på utkik efter någon signifikant variation mellan prognoserna som din modell producerar och de observerade dataen - speciellt om modellens utgångar motverkar sunt förnuft.Om det ser för bra ut, dåligt eller extremt för att vara sant, är det förmodligen inte sant (i verkligheten, ändå).
I utvärderingsprocessen granska noggrant utdata från de modeller du testar och jämför dem med ingångsvariablerna. Din modells prognosförmåga bör svara på alla angivna affärsmål som drivit skapandet i första hand.
Om fel eller fördomar uppstår i din modells utmatning, försök spåra dem tillbaka till
Giltigheten, pålitligheten och relativ säsongssituationen för data
-
Förutsättningar som används i modellen
-
Variabler som inkluderades eller uteslutits i analysen
-
Arbeta med företagsanvändare för att utvärdera varje steg i modellens process; se till att modellutgångarna enkelt kan tolkas och användas i en verklig affärssituation. Balansera noggrannheten och tillförlitligheten hos modellen med hur enkelt modellens utgångar kan tolkas och sättas i praktiken.
Hur man undviker icke-skalbara predictive analytics-modeller
När du bygger en modell, behåll alltid skalbarhet i åtanke. Kontrollera alltid prestanda, noggrannhet och tillförlitlighet hos modellen i olika vågar. Din modell ska kunna ändra sin skala - och skala upp så stor som nödvändigt - utan att falla ihop eller utföra dåliga förutsägelser.
Skalbarhet var en ganska utmaning tidigare. Prediktiva modeller tog lång tid att bygga och springa. Dataseterna som modellerna körde var små, och data var dyra att samla, lagra och söka. Men det var allt i "pre-big data" -tiden.
I dag är stora data billiga, rikliga och växande. Faktum är att ett annat potentiellt problem väger: Den formidabla datavolym som för närvarande finns tillgänglig kan påverka modellen negativt och försämra dess prestanda och fördröja modellen på relativt kort tid. Korrekt genomförd, skalbarhet kan hjälpa till att "framtida bevisa" din modell.
Framtiden är inte det enda hotet. Även i den nuvarande online-tiden kan strömmade data överväldiga en modell - speciellt om dataflöden ökar till en översvämning.
Enbart datavolym kan leda till att beslutsvariablerna och förutsäga faktorer växer till stora antal som kräver kontinuerlig uppdatering till modellen. Så ja, din modell hade bättre skalbarhet - snabbt skalbar.