Hem Personliga finanser Databegränsningarna i Prediktiv Analytics - Dummies

Databegränsningarna i Prediktiv Analytics - Dummies

Anonim

Som med många aspekter av ett företagsystem är data en mänsklig skapelse - så det är lämpligt att ha några gränser för användbarheten när du först skaffa det. Här följer en översikt över några begränsningar som du sannolikt kommer att stöta på:

  • Uppgifterna kan vara ofullständiga. Saknade värden, även om det saknas en sektion eller en väsentlig del av data, kan begränsa användbarheten.

    Till exempel kan dina data bara omfatta en eller två villkor för en större uppsättning som du försöker modellera - som när en modell som byggdes för att analysera aktiemarknadsresultatet endast har data tillgänglig från de senaste 5 åren, vilket skryter både uppgifterna och modellen mot antagandet om en tjurmarknad.

    När marknaden genomgår någon korrigering som leder till en björnmarknad, misslyckas modellen, helt enkelt eftersom den inte utbildades och testades med data som representerar en björnmarknad.

    Se till att du tittar på en tidsram som ger dig en komplett bild av de naturliga fluktuationerna i dina data. Dina uppgifter bör inte begränsas till säsongsmässighet .

  • Om du använder data från undersökningar, tänk på att personer inte alltid tillhandahåller korrekt information. Inte alla kommer att svara sanningsenligt om (hur mycket) de tränar - eller hur många alkoholhaltiga drycker de konsumerar - per vecka. Människor kanske inte är oärliga så mycket som självmedvetna, men data är fortfarande skevade.

  • Data som samlats in från olika källor kan variera i kvalitet och format. Uppgifter som samlas in från så olika källor som undersökningar, e-postmeddelanden, datainmatningsformulär och företagets webbplats kommer att ha olika egenskaper och strukturer. Data från olika källor kan inte ha mycket kompatibilitet mellan datafält. Sådan data kräver stor förbehandling innan den är analysberedd. Den bifogade sidofältet ger ett exempel.

Uppgifter som samlats in från flera källor kan ha skillnader i formatering, dubbla poster och inkonsekvenser i fusionerade datafält. Förvänta dig att spendera en lång tid på att rengöra sådana data - och till och med längre validera dess tillförlitlighet.

För att bestämma begränsningarna för dina data, se till att:

  • Verifiera alla variabler du ska använda i din modell.

  • Utvärdera dataens omfattning, särskilt över tiden, så din modell kan undvika säsongsmässiga fällor.

  • Kontrollera om det saknas värden, identifiera dem och bedöma deras inverkan på den övergripande analysen.

  • Se upp för extrema värden (outliers) och bestämma om de ska inkluderas i analysen.

  • Bekräfta att poolen av träning och testdata är tillräckligt stor.

  • Kontrollera att datatyp (heltal, decimala värden eller tecken osv.) Är korrekt och ställ in övre och nedre gränsen för möjliga värden.

  • Var särskilt uppmärksam på dataintegration när dina data kommer från flera källor.

Se till att du förstår dina datakällor och deras inverkan på den totala kvaliteten på dina data.

  • Välj ett relevant dataset som är representativt för hela befolkningen.

  • Välj rätt parametrar för din analys.

Oroa dig inte ens om du inte behöver analysera det noggrant om dina data fortfarande behöver förbehandling. Förbehandling tar ofta lång tid och betydande ansträngningar eftersom det måste ta itu med flera problem relaterade till originaldata - dessa problem inkluderar:

  • Några värden saknas från data.

  • Eventuella inkonsekvenser och / eller fel som finns i data.

  • Eventuella duplikat eller avvikande data i data.

  • Varje normalisering eller annan omvandling av data.

  • Eventuella härledda data som behövs för analysen.

Databegränsningarna i Prediktiv Analytics - Dummies

Redaktörens val

Jewish Funeral Traditions - dummies

Jewish Funeral Traditions - dummies

Judiska begravningar sker vanligen i en synagoge, begravningshem eller på en kyrkogård. Med tradition är judiska begravningar enkla (symboliserar tron ​​att människor är alla lika i döden), men de varierar mycket och har ingen uppsättning liturgi. Att skicka blommor till ett begravnings- eller sorgshem är starkt avskräckt i judendomen. Inte bara kommer ...

Identifiera komplicerade grävande dummies

Identifiera komplicerade grävande dummies

Komplicerat roende är det tekniska namnet som sorgproffs ger till en sorgprocess som sitter fast vid något tillfälle , vilket gör det omöjligt för de förlorade att framgångsrikt starta eller avsluta sorgprocessen. Komplicerat sorg är ofta ett tecken på olösta problem i förhållandet mellan de förlorade och den avlidne som gör det ...

Redaktörens val

Hur man ställer in kartkontroller i Main_iPad. Storyboard i din iOS App - dummies

Hur man ställer in kartkontroller i Main_iPad. Storyboard i din iOS App - dummies

När du har en anpassad vy för MapController i din iOS-app, måste du berätta för iPad-storyboardet att du laddar in din anpassade vy i stället för en UIViewController. Följ dessa steg: Välj Projekt navigator genom att välja Main_iPad. storyboard och välj sedan View Controller i View Controller - Map Scene i dokumentutskriften. ...

Hur man roterar objekt i din iOS-app - dummies

Hur man roterar objekt i din iOS-app - dummies

Här hittar du hur man rotera en vy (i så fall vrid bilen runt) i din iOS-app. För att göra det uppdaterar du den roterande kodstuben du startade med och ersätter den med den fetstilta koden. - (void) rotera {CGAffineTransform transform = CGAffineTransformMakeRotation (M_PI); void (^ animation) () = ^ () {self. bil. transformera = transformera; ...

Hur man ställer in en WeatherController i Main_iPad. storyboard-fil för din iOS-app - dummies

Hur man ställer in en WeatherController i Main_iPad. storyboard-fil för din iOS-app - dummies

Bör du lägga till en ny anpassad vykontroll till din iOS-app innan du fortsätter till dessa steg. Du behöver fortfarande berätta för storyboardet att du vill att den ska ladda den nya anpassade vykontrollen istället för en UIViewController. Följ dessa steg:

Redaktörens val

Spara en grafisk stil i Adobe CS5 Illustrator - dummies

Spara en grafisk stil i Adobe CS5 Illustrator - dummies

Adobe Creative Suite 5 (Adobe CS5) Illustrator tillåter Du sparar en grafisk stil. En grafisk stil är en kombination av alla inställningar du väljer för ett visst filter eller en effekt i Utseendepanelen. Genom att spara informationen i en grafisk stil lagras du dessa attribut så att du snabbt och enkelt kan tillämpa ...

Välj som ett transformationsverktyg i Adobe CS5 Illustrator - dummies

Välj som ett transformationsverktyg i Adobe CS5 Illustrator - dummies

I Adobe Creative Suite 5 (Adobe CS5 ) Illustratör du kan använda markeringsverktyget för att skala och rotera ett valt objekt. Dra begränsningsboxens handtag för att ändra storlek på objektet, eller flytta dig utanför ett handtag och sedan, när markören ändras till en flippig pil (en böjd pil med pilhuvud i båda ändarna), dra till ...

Objekttransformation i Adobe CS5 Illustrator - dummies

Objekttransformation i Adobe CS5 Illustrator - dummies

Verktygen Rotate, Reflect, Scale och Shear i Adobe Creative Suite 5 (Adobe CS5) Illustrator använder alla samma grundläggande steg för att utföra transformationer. Här är fem sätt att transformera ett objekt: en för en godtycklig omvandling och fyra andra för exakta omvandlingar baserat på en numerisk mängd som du anger. Vilkårlig omvandlingsmetod Eftersom detta ...