Video: medelvärde,median och typvärde 2024
Både medelvärdes- och röstsystem kan också fungera bra när du använder en blandning av olika maskininlärning algoritmer. Detta är metoden medelvärde, och används ofta när du inte kan minska estimatvarianansen.
När du försöker lära dig av data måste du prova olika lösningar och modellera dina data med olika lösningar för maskininlärning. Det är bra att kolla om du kan sätta några av dem framgångsrikt i ensembler med hjälp av prediktionsmedel eller genom att räkna de förutspådda klasserna. Principen är densamma som vid förpackning av icke-korrelerade förutsägelser, när modeller blandade ihop kan producera mindre varianspåverkade förutsägelser. För att uppnå effektiv medelvärde måste du
- Dela dina data i tränings- och testuppsättningar.
- Använd träningsdata med olika algoritmer för maskininlärning.
- Spela in förutsägelser från varje algoritm och utvärdera resultatet av resultatet med hjälp av testuppsättningen.
- Korrelera alla förutsägelser som är tillgängliga med varandra.
- Välj de förutsägelser som minst korrelerar och genomsnitts deras resultat. Eller, om du klassificerar, välj en grupp minst korrelerade förutsägelser och för varje exempel, välj som en ny klassprediktion den klass som majoriteten av dem förutspådde.
- Testa den nyligen beräknade eller röstade för majoritetsprediktionen mot testdata. Om du lyckas skapar du din sista modell genom att medelvärda resultaten av modelldelen av det framgångsrika ensemblet.
För att förstå vilka modeller som korrelerar minst, ta förutsägelserna en efter en, korrelera var och en mot de andra och genomsnittsa korrelationerna för att få en genomsnittlig korrelation. Använd den genomsnittliga korrelationen för att rangordna de valda förutsägelser som är mest lämpade för medelvärde.