Video: Markers Challenge w/ Digital Monster! With Osmo Monster Game 2024
När dina data är redo och du ska börja bygga din prediktiva modell för analys, är det användbart att beskriva din testmetodik och utarbeta en testplan. Testningen ska drivas av de affärsmål du har samlat in, dokumenterat och samlat in alla nödvändiga data för att hjälpa dig att uppnå.
Höger på fladdermusen bör du utforma en metod för att testa om ett affärsmål har uppnåtts. Eftersom predictive analytics mäter sannolikheten för ett framtida resultat - och det enda sättet att vara redo att köra ett sådant test är att träna din modell på tidigare data, måste du fortfarande se vad det kan göra när det gäller framtida data.
Du kan självklart inte riskera att köra en obestämd modell på verkliga framtida data, så du måste använda befintliga data för att simulera framtida data realistiskt. För att göra det måste du dela upp data som du arbetar med i träning och testdataset.
Kontrollera att du väljer dessa två dataset slumpmässigt och att båda dataseten innehåller och täcker alla dataparametrar du mäter.
När du delar upp dina data i test- och träningsdataset, undviker du effektivt eventuella överfittingproblem som kan uppstå genom att överträda modellen på hela datasetet och plocka upp alla ljudmönster eller specifika funktioner som bara hör till provdatasetet och är inte tillämpliga på andra dataset.
Att separera dina data i träning och testdataset, cirka 70 procent respektive 30 procent, säkerställer en noggrann mätning av prestandan i den prediktiva analysmodellen du bygger. Du vill utvärdera din modell mot testdata eftersom det är ett enkelt sätt att mäta huruvida modellens förutsägelser är korrekta.