Video: Forskar Grand Prix - Jesper Rydén - Uppsala universitet 2024
Vissa webbplatser på nätet skulle tro att statistik och maskininlärning är två helt olika tekniker. Om du till exempel läser Statistik vs Maskininlärning, slåss!, får du idén om att de två teknikerna inte bara är olika, utan exakt fientliga mot varandra. Faktum är att statistik och maskininlärning har mycket gemensamt och att statistiken representerar en av de fem stammarna (tankskolor) som gör maskinlärning möjlig. De fem stammarna är
- Symbolister: Ursprungen till denna stam är i logik och filosofi. Denna grupp bygger på invers avdrag för att lösa problem.
- Connectionists: Ursprunget till denna stam är i neurovetenskap. Denna grupp är beroende av backpropagation för att lösa problem.
- Evolutionaries: Denna stam stamas ursprung är i evolutionär biologi. Denna grupp bygger på genetisk programmering för att lösa problem.
- Bayesians: Denna stam stam härstammar i statistik. Denna grupp bygger på probabilistisk inferens för att lösa problem.
- Analysatorer: Ursprungen till denna stam är i psykologi. Denna grupp är beroende av kärnmaskiner för att lösa problem.
Det ultimata målet med maskininlärning är att kombinera de teknologier och strategier som omfamnas av de fem stammarna för att skapa en enda algoritm (mästaralgoritmen) som kan lära sig någonting. Naturligtvis är det långt ifrån att uppnå det målet. Trots detta arbetar forskare som Pedro Domingos för närvarande mot det målet.
Genom att använda den bayesiska stamstrategin löser du de flesta problem med någon form av statistisk analys. Du ser strategier som omfattas av andra stammar som beskrivs, men den viktigaste anledningen till att du börjar med statistiken är att tekniken redan är väl etablerad och förstådd. I själva verket kvalificerar många statistikelement mer än engineering (där teorier implementeras) än vetenskap (där teorier skapas). Att förstå algoritmernas roll i maskininlärning är viktigt för att definiera hur maskininlärning fungerar.