Video: Blackfish (2013) | Documentary 2024
Se till att du kontrollerar noga för outliers före de påverkar din prediktiva analys. Outliers kan förvränga både data och data analys. Till exempel slutar någon statistisk analys som görs med data som lämnar outliers på plats upphöra med medel och avvikelser.
Ej markerade eller felaktiga utestängningar kan leda till falska slutsatser. Säg dina uppgifter som visar att ett lager som handlades för ett helt år till ett pris över $ 50 - men för bara några minuter under det hela året var börsen handlas till $ 20. Priset på $ 20 - ett uppenbart undantag - är outlier i denna dataset.
Nu måste du bestämma om du ska inkludera $ 20 aktiekursen i din analys. om du gör det har det ramifications för den övergripande modellen. Men vad anser du som normalt? Var & ldquo; blixtkrasch & rdquo; som tog överraskning den 6 maj 2010, en normal händelse eller ett undantag?
Under den korta tiden upplevde aktiemarknaden en kraftig prisnedgång över hela linjen - som slog provkursen från $ 50 till $ 20, men hade mindre att göra med aktiemarknaden än med större marknadsförhållanden. Behöver din modell ta hänsyn till de större fluktuationerna på aktiemarknaden?
Den som har förlorat pengar på korta ögonblick på fritt fallsmarknaden anser att de få minuterna är verkliga och normala (även om de kände sig som en evighet att gå igenom). En portfölj som minskar i millisekunder på grund av en snabb nedgång, om än kortlivad, är klart verklig. Men flashkraschen är en anomali, en outlier som utgör ett problem för modellen.
Oavsett vad som anses vara normalt (vilket ändå kan ändras) innehåller data ibland värden som inte passar de förväntade värdena. Detta gäller speciellt på aktiemarknaden, där nästan varje händelse kan skicka marknaden som flyger eller döljer. Du vill inte att din modell ska misslyckas när verkligheten förändras plötsligt - men en modell och en verklighet är två olika saker.