Hem Personliga finanser Val av rätt algoritm för maskininlärning - dummies

Val av rätt algoritm för maskininlärning - dummies

Video: Steg 6. Maskininlärning, artificiell Intelligens & indikatorer. 2024

Video: Steg 6. Maskininlärning, artificiell Intelligens & indikatorer. 2024
Anonim

Del av maskinlärande för dummies Cheat Sheet < Maskininlärning innebär användning av många olika algoritmer. Denna tabell ger dig en snabb sammanfattning av styrkor och svagheter hos olika algoritmer.

Algoritm

Bäst på Fördelar Nackdelar Slumpmässig skog
Apt vid nästan alla maskininlärningsproblem Bioinformatik

Kan arbeta parallellt

Sällan överfyller > Behandlar saknade värden automatiskt

Inget behov av att ändra någon variabel

Det går inte att ändra parametrar

Kan användas av nästan alla med utmärkta resultat

Svårt att tolka

Svagare vid regression vid uppskattning av värden vid extremiteterna i fördelningen av responsvärden

Förskjutna i flerklassproblem mot frekventare klasser

Gradient Boosting

Apt vid nästan alla maskininlärningsproblem

Sökmotorer (lösa problemet med att lära sig att rangordna) > Det kan approximera mest olinjära funktionen Bäst i klasspredikern

Hanterar saknade värden automatiskt

Inget behov av att ändra någon variabel

Det kan överföras om det körs för många iterationer

Känslig för bullriga data och outliers

Fungerar inte bra utan parameterinställning

Linjär regression

Baseline predic

Ekonometriska förutsägelser

Modellering av marknadsresponser Enkelt att förstå och förklara

Det går sällan över

Med L1 och L2-regularisering är det effektivt att välja funktion

Snabbt träning

Lätt att Träna på stora data tack vare sin stokastiska version

Du måste arbeta hårt för att passa den i icke-linjära funktioner.

Kan drabbas av utelämnare.

Supportvektorer

Teckenigenkänning

Bildigenkänning

Text klassificering Automatisk olinjär funktion skapande

Kan approximera komplexa olinjära funktioner

Svårt att tolka vid tillämpning av icke-linjära kärnor

Lider av alltför många exempel. Efter 10 000 exempel börjar det ta för lång tid att träna

K-närmaste grannar

Datorsyn

Multilabel-taggning

Recommender-system Stavningskontrollproblem

Snabb och lat träning

Kan naturligtvis hantera extrema multiclassproblem (t.ex. taggtext)

Slow och besvärlig i den förutsägande fasen

Kan misslyckas med att förutsäga corr

Adaboost

Ansiktsigenkänning

Hanterar saknade värden automatiskt

Det går inte att omforma någon variabel Det går inte lätt att överföra Få parametrar att tweak > Naive Bayes

Ansiktsigenkänning

Sentimentanalys

Spam-detektering

Kännetecknande för spridningsdetektering

Text klassificering

Enkelt och snabbt att implementera, kräver inte för mycket minne och kan användas för online-lärande

Lätt att förstå Med hänsyn till förkunskaper

Starka och orealistiska kännetecken för självständighetsförutsättningar > Bildigenkänning

Språkigenkänning och översättning

Taligenkänning

Visionsigenkänning

Kan approximera någon olinjär funktion

Robust till outliers

Fungerar endast med en del av exemplen (supportvektorn s)

Mycket svårt att ställa in

Svårt att ställa på grund av för många parametrar och du måste också bestämma nätverkets arkitektur

Svårt att tolka Lätt att övergå

Logistisk regression < Beställa resultat med sannolikhet

Modellering av marknadsreaktioner

Enkelt att förstå och förklara

Det övergår sällan

Med L1 och L2-regularisering är effektiv i funktionen val

Den bästa algoritmen för att förutsäga sannolikheten för en händelse

Snabbt träning

Lätt att träna på stora data tack vare sin stokastiska version

Du måste arbeta hårt för att passa in i olinjära funktioner.

Kan drabbas av outliers

SVD Recommender system

Kan omstrukturera data på ett meningsfullt sätt

Svårt att förstå varför data har omstrukturerats på ett visst sätt

PCA

Ta bort collinearity

Minska datadimensionens minskning

Antyder starka linjära antaganden (komponenter är en viktad summering av funktioner) K-means

Segmentering

Snabbt att hitta kluster

Kan upptäcka avvikande enheter i flera dimensioner Förluster från multikollinearitet Kluster är sfäriska, kan inte detektera grupper av annan form Instabil lösningar, beror på initialisering
Val av rätt algoritm för maskininlärning - dummies

Redaktörens val

Fastighetsprofessionens grunder för fastighetslicensexamen - dummies

Fastighetsprofessionens grunder för fastighetslicensexamen - dummies

Fastighetsexamen kommer att förvänta dig att du har ett grundläggande grepp på fastighetsbranschen. Du tror att det bara är uppenbart att veta vad de viktigaste spelarna gör i en fastighetsaffär, men på grund av den terminologi de delar, blir skillnaderna mellan spelarna lite muddlade. Här är snabba beskrivningar ...

Kostnadsmetoden för fastighetslicensexamen - dummies

Kostnadsmetoden för fastighetslicensexamen - dummies

En metod för att uppskatta Värdet på fastigheter kallas kostnaden. Du måste känna till formeln för fastighetslicensexamen. Kostnadsmetoden baseras på tanken att komponenterna i en fastighet eller marken och byggnaderna kan läggas till för att komma fram till ...

Studie för fastighetslicensexamen - dummies

Studie för fastighetslicensexamen - dummies

När var sista gången du tog en multipelvalsexamen ? Eller, för den delen, någon examen? Det är troligt att det var länge sedan. Kanske överväger du huruvida du ska bli en fastighetsmäklare, men du är lite avskräckt av tanken på att du måste göra ett test. Vad du kan ...

Redaktörens val

Följer ett basketspel på tv - dummies

Följer ett basketspel på tv - dummies

Du kommer bli mycket mer ute av att titta på ett basketspel på TV - eller till och med leva - om du gör mer än att se bollen gå in i rammen. Kolla in dessa insider tips för att fånga den verkliga åtgärden och öka din njutning av sporten. Förutse nästa pass Försök att tänka som ...

Top 5 Fantasy Basketball League Sites - Dummies

Top 5 Fantasy Basketball League Sites - Dummies

Att hitta och gå med på en fantasy basketplats kan ibland vara skrämmande uppgift eftersom så många alternativ är tillgängliga och de flesta webbplatser ser lika ut. Bara för att webbplatser ser ut som det betyder inte nödvändigtvis att de mäter i värde. Vissa webbplatser erbjuder gratis ligor, andra betalade - och vissa webbplatser tillhandahåller bara standard liga ...

Tryck på motståndarna i Basket - Dummies

Tryck på motståndarna i Basket - Dummies

Pressen är kort för tryck. Ofta kallad en fullrättspress, det här är ett anfallande försvar som används på backen, där målet är att tvinga en omsättning. Vanligtvis används efter en gjord korg, svänger pressgruppen över motståndarna i backcourt; Om motståndarna lyckas få bollen förbi halvvägs (kallad brytning ...

Redaktörens val

Hur R beräknar oändliga, odefinierade och saknade värden - dummies

Hur R beräknar oändliga, odefinierade och saknade värden - dummies

Lyckligtvis kan R hantera dataanomalier som förvirrar några andra statistiska plattformar. I vissa fall har du inte reella värden att beräkna med. I de flesta verkliga dataset saknas faktiskt åtminstone några värden. Dessutom har vissa beräkningar oändlighet som ett resultat (som att dividera med noll) eller kan inte ...

Hur man lägger till linjer i en plot i R-dummies

Hur man lägger till linjer i en plot i R-dummies

I R, lägger du till rader i en plott på ett mycket liknande sätt att lägga till poäng, förutom att du använder funktionen linjer () för att uppnå detta. Men använd först lite R magi för att skapa en trendlinje genom data, kallad en regressionsmodell. Du använder lm () -funktionen för att uppskatta en linjär ...

Hur man lägger till en andra dimension i R-dummies

Hur man lägger till en andra dimension i R-dummies

Förutom vektorer kan R representera matriser som ett objekt du arbetar och beräknar med. Faktum är att R verkligen lyser när det gäller matrisberäkningar och -operationer. Vektorer är nära relaterade till en större klass av objekt, arrays. Arrayer har två mycket viktiga egenskaper: De innehåller bara en enda typ av värde. De har ...