Hem Personliga finanser Gränserna för betygsdata i maskinlärande - dummies <[SET:descriptionsv]Ratingdata har begränsningar i maskininlärning.

Gränserna för betygsdata i maskinlärande - dummies <[SET:descriptionsv]Ratingdata har begränsningar i maskininlärning.

Video: Här går gränserna för hets mot folkgrupp - Nyhetsmorgon (TV4) 2024

Video: Här går gränserna för hets mot folkgrupp - Nyhetsmorgon (TV4) 2024
Anonim

Ratingdata har begränsningar i maskininlärning. För att rekommendera system för att fungera bra behöver de veta både dig och andra, både som du och annorlunda än dig. Att skaffa betygsuppgifter gör det möjligt för ett rekommenderingssystem att lära av erfarenheterna från flera kunder. Betygsuppgifter kan härledas från en dom (t.ex. att betygsätta en produkt med hjälp av stjärnor eller siffror) eller ett faktum (en binär 1/0 som helt enkelt säger att du köpte produkten, såg en film eller slutade bläddra på en viss webbsida.)

Oavsett datakälla eller typ, är betygsdata alltid om beteenden. För att betygsätta en film måste du bestämma dig för att se den, titta på den och värdera den utifrån din erfarenhet av att se filmen. Faktiska recommender-system lär dig av klassificeringsdata på olika sätt:

  • Samarbetande filtrering: Matcher Raters baserat på film eller produkt likheter som används tidigare. Du kan få rekommendationer baserat på objekt gillade av människor som liknar dig eller på saker som liknar dem du gillar.
  • Innehållsbaserad filtrering: Går utöver det faktum att du tittade på en film. Den undersöker funktionerna i förhållande till dig och filmen för att avgöra om det finns en matchning baserad på de större kategorierna som funktionerna representerar. Till exempel, om du är en kvinna som gillar actionfilmer, kommer recommender leta efter förslag som omfattar korsningen av dessa två kategorier.
  • Kunskapsbaserade rekommendationer: Baserat på metadata, t.ex. preferenser uttryckta av användare och produktbeskrivningar. Den är beroende av maskininlärning och är effektiv när du inte har tillräckligt med beteendemata för att bestämma användar- eller produktegenskaper. Detta kallas en kallstart och representerar en av de svåraste rekommendationsuppgifterna eftersom du inte har tillgång till samarbetsfiltrering eller innehållsbaserad filtrering.

När du använder samarbetsfiltrering måste du beräkna likhet. Bortsett från Euclidean, Manhattan och Chebyshev avstånd, diskuterar resten av denna information cosinuslikhet. Cosinell likhet mäter vinkelkosinavståndet mellan två vektorer, vilket kan tyckas vara ett svårt begrepp att förstå men är bara ett sätt att mäta vinklar i datalager.

Föreställ dig ett utrymme av funktioner och med två punkter. Du kan mäta avståndet mellan punkterna. Till exempel kan du använda det euklidiska avståndet, vilket är ett perfekt val när du har få dimensioner, men som misslyckas elakt när du har flera dimensioner på grund av dimensionen.

Tanken bakom cosinusavståndet är att använda den vinkel som skapas av de två punkterna som är kopplade till rymdets ursprung (punkten där alla dimensioner är noll) istället. Om punkterna är nära är vinkeln smal, oavsett hur många dimensioner det finns. Om de är långt borta är vinkeln ganska stor.

Kosinisk likhet implementerar cosinusavståndet i procent och är ganska effektivt för att berätta om en användare liknar en annan eller huruvida en film kan associeras med en annan eftersom samma användare föredrar det. Följande exempel lokaliserar de filmer som är de mest liknande filmerna till film 50, Star Wars.

print (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

liknande_movies <- likhet (MovieLense [50],

MovieLense [-50]

metod = "cosinus",

vilka = "objekt")

colnames (similar_movies) [vilket (similar_movies> 0. 70)]

[1] "Toy Story (1995)" < "Empire Strikes Back, The (1980)"

[3] "Raiders of the Lost Ark (1981)"

"Return of the Jedi (1983)"

Gränserna för betygsdata i maskinlärande - dummies <[SET:descriptionsv]Ratingdata har begränsningar i maskininlärning.

Redaktörens val

Hur man redigerar bilder i Redigera snabbläge för Photoshop Elements 9 - dummies

Hur man redigerar bilder i Redigera snabbläge för Photoshop Elements 9 - dummies

I Photoshop Element, Redigera Snabbt läge är en uppskattad version av Redigera fullt läge som ger grundläggande fixverktyg tillsammans med några unika funktioner, till exempel en förhandsgranskning av bilden. Här är ett steg för steg arbetsflöde som du kan följa i Redigera snabbläge för att reparera dina foton: Välj ett eller flera foton i ...

Hur man redigerar i Photoshop Elements 10: s Snabb Fotoredigeringsläge - dummies

Hur man redigerar i Photoshop Elements 10: s Snabb Fotoredigeringsläge - dummies

Snabb Fotoredigering är en uppskattad version av Full Photo Edit-läge som bekvämt ger grundläggande fixeringsverktyg och kastar i några unika egenskaper, till exempel en förhandsgranskning av bilden. Här är ett steg för steg arbetsflöde som du kan följa i Quick Photo Edit-läget för att reparera dina foton:

Hur man förbättrar Photoshop Elements-bilder med Photo Effects - dummies

Hur man förbättrar Photoshop Elements-bilder med Photo Effects - dummies

Fotoeffekter i Photoshop Elements 11 fungerar som applicera filter; medan dialogrutan Filtreringsgalleri ger dig många alternativ för att tillämpa ett filter, ger den guidade panelen dig filtereffekter och tar dig genom steg för att justera ljusstyrka, ändra färgton och mättnad och göra andra justeringar för att perfekta resultatet. Du ...

Redaktörens val

Hur man tar bort bilder från din Canon EOS 7D Mark II - dummies

Hur man tar bort bilder från din Canon EOS 7D Mark II - dummies

När du granskar en bild, bestämmer du om det är en målvakt. Om du tittar på en bild på din Canon EOS 7D Mark II, gillar du inte bilden av någon anledning kan du radera det. Men borttagning av bilder måste ske med stor försiktighet eftersom uppgiften inte kan ångras. När du har raderat en ...

Hur man redigerar filmer på en Canon EOS 60D - dummies

Hur man redigerar filmer på en Canon EOS 60D - dummies

60D Edit-funktionen gör det härligt enkelt för att ta bort oönskade delar från början eller slutet av en film direkt på din kamera. Denna ombordredigering är praktisk men grundläggande, så förvänta dig inte mirakel. Här är de enkla stegen för att trimma början eller slutet på en film: Klicka på ikonen Redigera (det ser ut ...

Redaktörens val

Hur man arbetar med text i ett Word 2010-tabell - dummies

Hur man arbetar med text i ett Word 2010-tabell - dummies

Text hinner i ett bord i Word 2010 på en cell-vid-cell basis. Varje cell i ett Word-bord kan ha ett eget styckeformat och en egen uppsättning flikar. Grupper av celler, rader och kolumner och hela tabellen kan väljas och formateras samtidigt, om du vill. All standardtext ...

Hur man arbetar med Word 2010: s decimala flik - dummies

Hur man arbetar med Word 2010: s decimala flik - dummies

Du kan använda decimalfliken i Word 2010 till rad upp kolumner av siffror. Även om du kan använda en rätt flik för att göra detta jobb är decimalfliken ett bättre val. I stället för högerjusterad text, som den högra fliken gör, justerar decimalfliken siffror efter deras decimaldel - perioden i ...

Hur man arbetar med flera Word 2010-dokument på samma gång - dummies

Hur man arbetar med flera Word 2010-dokument på samma gång - dummies

O saker Word 2010 kan göra med dokument! Du kan öppna flera Word-dokument samtidigt och arbeta på mycket av dem, växla mellan de olika öppna dokumenten. Öppnar flera Word-dokument samtidigt Det är inte en fråga om hur Word kan fungera på mer än ett dokument åt gången. Nej, ...