Hem Personliga finanser Lära känna gränserna för bias i maskinlärande - dummies

Lära känna gränserna för bias i maskinlärande - dummies

Video: What does my headscarf mean to you? | Yassmin Abdel-Magied 2024

Video: What does my headscarf mean to you? | Yassmin Abdel-Magied 2024
Anonim

Maskininlärning beror mycket på in-sample data. Denna del av dina data är viktig eftersom du vill upptäcka världens synvinkel och som med alla synvinklar kan det vara fel, förvrängt eller bara bara partiell. Du vet också att du behöver ett exemplar utanför provet för att kontrollera om lärandeprocessen fungerar. Dessa aspekter utgör emellertid bara en del av bilden.

När du gör en maskininlärningsalgoritm arbetar med data för att gissa ett visst svar, spelar du effektivt en spelning, och den spelningen är inte bara på grund av det prov du använder för att lära dig. Det finns mer. Föreställ dig för närvarande att du har fri tillgång till lämpliga, opartiska, in-sample data, så data är inte problemet. Istället måste du koncentrera dig på metoden för att lära och förutse.

Först måste du tänka på att du satsar på att algoritmen rimligen kan gissa svaret. Du kan inte alltid göra detta antagande eftersom det inte går att bestämma vissa svar, oavsett vad du vet i förväg.

Du kan till exempel inte helt bestämma människors beteende genom att känna till deras tidigare historia och beteende. Kanske är en slumpmässig effekt involverad i det generativa processen med vårt beteende (till exempel den irrationella delen av oss), eller kanske kommer frågan upp till fri vilja (problemet är också en filosofisk / religiös, och det finns många diskreta åsikter). Följaktligen kan du bara gissa vissa typer av svar, och för många andra, till exempel när du försöker förutse folks beteende måste du acceptera en viss grad av osäkerhet som med lycka är acceptabel för dina ändamål.

För det andra måste du överväga att du satsar på att förhållandet mellan informationen du har och det svar du vill förutsäga kan uttryckas som en matematisk formel av något slag och att din maskininlärning algoritmen kan faktiskt gissa den formeln. Kapaciteten hos din algoritm för att gissa den matematiska formeln bakom ett svar är inbyggt inbäddat i algoritmens muttrar och bultar.

Vissa algoritmer kan gissa nästan allting; andra har faktiskt en begränsad uppsättning alternativ. Utbudet av möjliga matematiska formuleringar som en algoritm kan gissa är uppsättningen av sina möjliga hypoteser. Följaktligen är en hypotes en enda algoritm, specificerad i alla dess parametrar och därför kapabel till en enda, specifik formulering.

Matematiken är fantastisk. Det kan beskriva mycket av den verkliga världen genom att använda en viss enkel notering, och det är kärnan i maskininlärning eftersom en inlärningsalgoritm har en viss förmåga att representera en matematisk formulering.Vissa algoritmer, såsom linjär regression, använder uttryckligen en specifik matematisk formulering för att representera hur ett svar (till exempel priset på ett hus) hänför sig till en uppsättning av prediktiv information (såsom marknadsinformation, husplats, boendets yta, och så vidare).

Vissa formuleringar är så komplexa och invecklade att även om de representerar dem på papper är möjligt, gör det i praktiken för svårt. Några andra sofistikerade algoritmer, såsom beslutsträd, har ingen explicit matematisk formulering, men är så anpassningsbara att de enkelt kan sättas till ett stort antal formuleringar. Tänk på en enkel och lättförklarad formulering. Den linjära regressionen är bara en linje i ett koordinatutrymme som ges av svaret och alla prediktorer. I det enklaste exemplet kan du få ett svar, y och en enda prediktor, x, med en formulering av

y = β 1 x 1 + β 0

I en enkel situation av ett svar som förutses av en enda funktion är en sådan modell perfekt när din data ordnar sig som en linje. Men vad händer om det inte gör det och istället formar sig som en kurva? För att representera situationen, observera bara följande tvådimensionella representationer.

Exempel på en linjär modell som kämpar för att kartlägga en kurvfunktion.

När punkter liknar en linje eller ett moln, inträffar något fel när du bestämmer dig för att resultatet är en rak linje; Därför är kartläggningen som tillhandahålls av den föregående formuleringen på något sätt oklara. Felet visas emellertid inte systematiskt men ganska slumpmässigt eftersom vissa punkter ligger över den mappade raden och andra är under den. Situationen med det krökta, formade punktmolnet är annorlunda, för denna gång är linjen ibland exakt men vid andra tillfällen är det systematiskt fel. Ibland är poäng alltid över linjen; ibland är de under den.

Med tanke på enkelheten i kartläggningen av svaret tenderar din algoritm att systematiskt överskatta eller underskatta de reella reglerna bakom data som representerar dess bias. Förspänningen är karakteristisk för enklare algoritmer som inte kan uttrycka komplexa matematiska formuleringar.

Lära känna gränserna för bias i maskinlärande - dummies

Redaktörens val

ASVAB Aritmetisk Reasoning (Math Word Problem) Practice Questions - Dummies

ASVAB Aritmetisk Reasoning (Math Word Problem) Practice Questions - Dummies

Aritmetik Reasoning questions are math problem som uttrycks i ett historiaformat. Ditt mål är att bestämma vad frågan frågar genom att plocka ut relevanta faktorer som behövs för att lösa problemet, ställa in matematiska ekvationer efter behov och komma fram till rätt lösning. Låter enkelt, eller hur? Provfrågor Försök din hand på följande ...

ASVAB Aritmetisk Reasoning Practice: Pengarproblem - Dummies

ASVAB Aritmetisk Reasoning Practice: Pengarproblem - Dummies

Alla har pengarproblem och den Aritmetiska Reasoning-undersökningen på ASVAB är inget undantag. Den goda nyheten är att du kan lösa problemen på ASVAB med bara en liten algebra. Övningsfrågor Dan köpte en fiskespole från David Edwins Fishing Emporium för 15 dollar. 95. Dan spenderade lite pengar på bete och två gånger ...

ASVAB Aritmetisk Reasoning Practice: Ojämlikheter - dummies

ASVAB Aritmetisk Reasoning Practice: Ojämlikheter - dummies

Den aritmetiska Reasoning-undersökningen på ASVAB kommer att innehålla vissa ojämlikhetsfrågor. Du kan identifiera dem eftersom de innehåller fraser som "åtminstone" och "mindre än eller lika med. "Practice-frågor Express matematiskt: Produkten av x och y är större än eller lika med kvoten av b och c. Benjamin arbetar 15 timmar ...

Redaktörens val

Java Programmering: Läsning av en linje i taget - dummies

Java Programmering: Läsning av en linje i taget - dummies

I denna Java-kodlista, PayOneEmployee Metoden illustrerar några användbara knep för att läsa data. I synnerhet varje skanner som du skapar har en NextLine-metod. (Du kan inte använda den här nästaLine-metoden, men metoden är ändå tillgänglig.) När du ringer en skanners nästaLine-metod tar metoden allt fram till slutet av ...

Java Programmering: Läsning från en fil - dummies

Java Programmering: Läsning från en fil - dummies

Många Java-program läser tecken från datorns tangentbord. Dessa program använder saker som Scanner, System. i och nextDouble - saker definierade i Java API. DoPayroll-programmet i den här listan lägger en ny spinn på den här historien. I stället för att läsa tecken från tangentbordet läser programmet tecken från EmployeeInfo. txt-fil. Filen lever ...

Java Programmering: Att ställa in datorn för att göra någonting - dummies

Java Programmering: Att ställa in datorn för att göra någonting - dummies

I Listning 1 nedan en spräng av Java-kod. Liksom alla nybörjare programmerare, förväntas du gawk ödmjukt vid koden. Men var inte skrämmad. När du hänger på det är programmeringen ganska lätt. Ja, det är roligt också. Listning 1: Ett enkelt Java-program / * * Ett program för att lista ...

Redaktörens val

Hur man lägger till bilder i ditt PowerPoint 2007 Photo Album - dummies

Hur man lägger till bilder i ditt PowerPoint 2007 Photo Album - dummies

Du kan placera bildtexter under bilderna i ditt PowerPoint fotoalbum. PowerPoint placerar först filnamnet i bildtexten, men du kan ta bort den här bildtexten och ange en av dina egna. För att lägga till bildtexter i ditt fotoalbum, följ dessa steg:

Hur man lägger till kommentarer till PowerPoint 2013 Presentationer - dummies

Hur man lägger till kommentarer till PowerPoint 2013 Presentationer - dummies

En kommentar i PowerPoint 2013 är mycket som en fästis. Skönheten i kommentarerna är att du kan slå dem på och av. Därför kan du se kommentarerna medan du redigerar din presentation, och du kan stänga av dem när det är dags för showen. För att lägga till en kommentar till en presentation, ...

Hur man lägger till Clip Art i en PowerPoint 2007 Slide - dummies

Hur man lägger till Clip Art i en PowerPoint 2007 Slide - dummies

PowerPoint Clip Art-uppgiftsrutan som låter dig söka efter nyckelord för en bild för att pryda din PowerPoint-presentation. Första gången du öppnar uppgiftspanelen i PowerPoint Clip Art, frågar en dialogruta att du söker efter hårddisken och katalogiserar alla dina bilder. Då kan du komma åt din ...