Video: HUR VI FAKEADE ATT VI VAR MED I NETFLIX FILM 2024
stödvektormaskinen (SVM) är en prediktiv analysdata-klassificeringsalgoritm som tilldelar ny dataelement till en av märkta kategorier. SVM är i de flesta fall en binär klassificerare; Det antas att de aktuella uppgifterna innehåller två möjliga målvärden.
En annan version av SVM-algoritmen, multiclass SVM, ökar SVM som klassificerare på en dataset som innehåller mer än en klass (gruppering eller kategori). SVM har framgångsrikt använts i många applikationer såsom bildigenkänning, medicinsk diagnos och textanalys.
Antag att du utformar en prediktiv analysmodell som automatiskt identifierar och förutser namnet på ett objekt i en bild. Detta är i grunden problemet med bildigenkänning - eller mer specifikt ansiktsigenkänning: Du vill att klassificeringen ska känna igen namnet på en person i ett foto. Tänk på en enklare version av samma problem innan du hanterar denna nivå av komplexitet: Antag att du har bilder på enskilda bitar av frukt och du vill att din klassificerare förutspår vilken typ av frukt som visas på bilden. Antag att du bara har två typer av frukt: äpplen och päron, en per bild.
Antag att du har 200 bilder av olika äpplen och 200 bilder av päron. Inlärningssteget består i att mata dessa bilder till klassificatorn så att det lär sig hur ett äppel ser ut och hur en päron ser ut. Innan du kommer in i det här första steget måste du omvandla varje bild till en datamatris med hjälp av (säg) R-statistikpaketet.
Som du kan tänka dig representerar en bild som en matris av siffror inte exakt en enkel uppgift. Ett helt distinkt forskningsområde ägnas åt bildrepresentation.
Nedan visas hur en stödvektormaskin kan förutsäga en fruktklass (märkning matematiskt som
äpple eller päron ), baserat på vad algoritmen har lärt sig tidigare. Antag att du har konverterat alla bilder till datamatriser. Sedan har stödvektorns maskin två huvudingångar:
Tidigare (träningsdata): Denna uppsättning matriser motsvarar tidigare sedda bilder av äpplen och päron.
-
Den nya (osynliga) data består av en bild som konverteras till en matris. Syftet är att automatiskt förutse vad som finns på bilden - ett äpple eller en päron.
-
Stödvektorn använder en matematisk funktion, ofta kallad en
kärnfunktion som är en mattefunktion som matchar den nya dataen till den bästa bilden från träningsdata för att kunna förutse den okända bildens etikett (äpple eller päron). I jämförelse med andra klassificerare ger supportvektormaskiner robusta, exakta förutsägelser, påverkas minst av bullriga data och är mindre benägna att överföras. Tänk dock på att stödvektorer är bäst lämpade för binär klassificering - när du bara har två kategorier (till exempel äpple eller päron).