Innehållsförteckning:
- Grunderna för taggar för att beskriva artiklar
- (Tänk på det som en uppsättning perfekta matchningar - vanligtvis en liten uppsättning) och
- (Tänk på det som en uppsättning möjliga matchningar - vanligtvis en större uppsättning). Här är en närmare titt:
Video: Grunderna för riktigt bra wedgar 2024
Innehållsbaserad Rekommendationssystem för predictive analytics matchar mestadels funktioner (taggade sökord) bland liknande föremål och Användarens profil att göra rekommendationer. När en användare köper ett objekt som har taggade funktioner, rekommenderas objekt med funktioner som matchar originalets original. Ju fler funktioner matchar desto högre sannolikhet kommer användaren att gilla rekommendationen. Denna grad av sannolikhet kallas precision.
Grunderna för taggar för att beskriva artiklar
I allmänhet märker företaget som gör försäljningen (eller tillverkaren) vanligtvis sina föremål med nyckelord. På Amazonas hemsida är det dock ganska typiskt att aldrig se taggarna för några inköpta eller visade varor - och inte ens att bli ombedda att märka ett objekt. Kunderna kan granska de objekt som de har köpt, men det är inte detsamma som taggning.
Märkningsposter kan utgöra en skalautmaning för en butik som Amazon som har så många saker. Dessutom kan vissa attribut vara subjektiva och kan vara felaktigt märkta, beroende på vem som märker det. En lösning som löser skaleringsproblemet är att tillåta kunder eller allmänheten att märka objekten.
För att hålla taggar hanterbara och korrekta kan en acceptabel uppsättning taggar tillhandahållas av webbplatsen. Endast när ett lämpligt antal användare är överens (det vill säga använda samma tag för att beskriva ett objekt), kommer den överenskomna taggen att användas för att beskriva objektet.
Användarbaserad taggning uppstår dock andra problem för ett innehållsbaserat filtreringssystem (och samarbetsfiltrering):
-
Trovärdighet: Inte alla kunder berättar sanningen (särskilt online) och användare som har endast en liten ratinghistorik kan skingra data. Dessutom kan vissa leverantörer ge (eller uppmuntra andra att ge) positiva betyg till sina egna produkter samtidigt som de ger negativa värderingar till sina konkurrenters produkter.
-
Sparsity: Alla objekt kommer inte att klassificeras eller kommer att ha tillräckligt med betyg för att producera användbar data.
-
Inkonsekvens: Inte alla användare använder samma nyckelord för att tagga ett objekt, även om innebörden kan vara densamma. Dessutom kan vissa attribut vara subjektiva. Till exempel kan en tittare av en film betrakta den kort medan en annan säger att det är för långt.
Egenskaper behöver tydliga definitioner. Ett attribut med för få gränser är svårt att utvärdera; Att införa för många regler om ett attribut kan vara att användarna ska göra för mycket arbete, vilket kommer att hindra dem från att märka objekt.
Att mäta de flesta objekt i en produktkatalog kan hjälpa till att lösa det kallstartsproblem som plågar samarbetsfiltrering.Under ett tag kommer dock precisionen i systemets rekommendationer att vara låga tills den skapar eller erhåller en användarprofil.
Här är en provmatris av kunder och deras köpta objekt, visar ett exempel på innehållsbaserad filtrering. Funktion 4
Funktion 5 | Artikel 1 | X | X | Artikel 2 | Funktion 3 |
---|---|---|---|---|---|
Funktion 4 | Funktion 5 | X | |||
X | X | X | |||
X | Punkt 4 | X | X | ||
X | Punkt 5 | X > X | X | ||
Om en användare tycker om Feature 2 - och det spelas in i hennes profil - kommer systemet att rekommendera alla objekt som har funktion 2 i dem: Artikel 1, 2 och 4. > Detta tillvägagångssätt fungerar även om användaren aldrig har köpt eller granskat ett objekt. Systemet kommer bara att se i produktdatabasen för något objekt som har taggats med Feature 2. Om (till exempel) en användare som letar efter filmer med Audrey Hepburn - och den här preferensen dyker upp i användarens profil - kommer systemet att rekommendera alla de filmer som har Audrey Hepburn till den här användaren. | Detta exempel exponerar emellertid snabbt en begränsning av den innehållsbaserade filtreringstekniken: Användaren känner förmodligen redan om alla filmer som Audrey Hepburn har varit i, eller kan lätt ta reda på - så från användarens synvinkel, har systemet inte rekommenderat något nytt eller av värde. | Hur man förbättrar precisionen med ständig återkoppling | Ett sätt att förbättra precisionen i systemets rekommendationer är att be kunderna få feedback när det är möjligt. Samla kundrespons kan göras på många olika sätt, via flera kanaler. Vissa företag ber kunden att bedöma ett föremål eller en tjänst efter inköpet. Andra system tillhandahåller länkar i sociala medier, så att kunderna kan "tycka om" eller "ogillar" en produkt. Ständigt växelverkan mellan |
Hur mäter systemrekommendationernas effektivitet
Ett systems rekommendationer är framgångsrika beroende på hur väl det uppfyller två kriterier:
precision
(Tänk på det som en uppsättning perfekta matchningar - vanligtvis en liten uppsättning) och
återkalla
(Tänk på det som en uppsättning möjliga matchningar - vanligtvis en större uppsättning). Här är en närmare titt:
Precision mäter hur exakt systemets rekommendation var. Precision är svår att mäta eftersom det kan vara subjektivt och svårt att kvantifiera. Till exempel, när en användare besöker Amazonas webbplats först, kan Amazon säkert veta om dess rekommendationer är på mål? Vissa rekommendationer kan kopplas till kundens intressen men kunden kan fortfarande inte köpa. Det högsta förtroendet för att en rekommendation är exakt kommer från tydliga bevis: Kunden köper objektet. Alternativt kan systemet uttryckligen be användaren att bedöma sina rekommendationer. Recall mäter uppsättningen möjliga bra rekommendationer som ditt system uppstår. Tänk på återkallelse som en inventering av möjliga rekommendationer, men inte alla är perfekta rekommendationer. Det finns i allmänhet ett omvänt förhållande till precision och återkallelse. Det är, som återkallingen går upp, går precisionen ner och vice versa.
-
Det ideala systemet skulle ha både hög precision och hög återkallelse. Men realistiskt är det bästa resultatet att få en delikat balans mellan de två. Att påpeka precision eller återkallelse beror verkligen på det problem du försöker lösa.