Video: Technology Innovation Ep1: Chief Medical Officer 2024
I övervakad analys, båda inmatningarna och föredragen utmatning är en del av träningsdata. Den prediktiva analysmodellen presenteras med de rätta resultaten som en del av dess inlärningsprocess. Ett sådant övervakat lärande förutsätter förklassificerade exempel: Målet är att få modellen att lära av den tidigare kända klassificeringen så att den korrekt kan märka nästa okända datapunkt utifrån vad den har lärt sig.
När modellens träning är avslutad, utgår en matematisk funktion genom att undersöka träningsdata. Den funktionen kommer att användas för att märka nya datapunkter.
För att detta sätt ska fungera korrekt måste träningsdata - tillsammans med testdata - väljas noggrant. Den utbildade modellen ska kunna förutsäga rätt etikett för en ny datapunkt snabbt och exakt baserat på datatypen som modellen har sett i träningsdata.
Övervakad analytik erbjuder några olika fördelar:
-
Analytikern ansvarar för processen.
-
Märkning baseras på kända klassificeringar.
-
Märkningsfel kan enkelt lösas.
Baksidan av dessa fördelar är en lika distinkt uppsättning potentiella nackdelar:
-
Eventuella misstag vid träningsfasen kommer att förstärkas senare.
-
Analysorns klassificering får inte beskriva hela befolkningen på ett adekvat sätt.
-
Modellen kan inte upptäcka klasser som avviker från den ursprungliga träningsuppsättningen.
-
Antagandet att klustren inom data inte överlappar varandra - och att de lätt kan separeras - kan inte visa sig giltiga.