Video: Penis Health and Growth Indicators! 2024
Det första steget mot prediktiv modellering är att relatera variabler till varandra. Ett enkelt, anmärkningsvärt verktyg för det är scatterplot. Det är vanligt att relatera en kontinuerlig åtgärd till en annan. Data miners sträcker sig ibland reglerna och använder det med kategoriska variabler också.
Den horisontella ( x ) axeln för diagrammet representerar värden för en variabel; Den vertikala axeln ( y ) representerar en andra variabel. Du kanske inte har en känsla av vilken variabel som är oberoende och vilken är beroende av varje par av variabler.
Om du gör det borde den oberoende variabeln ligga på den horisontella axeln. Varje punkt på plottet representerar koordinaterna, värdet par för de två variablerna i ett enda fall. (Dessa par kallas ibland xy par ).
Hitta ditt scatterplotverktyg och skapa ett grundläggande scatterplot-verktyg genom att välja två variabler att använda. Följande bild visar detta verktyg på Orange-menyn; platsen för verktyget varierar efter produkt.
Exemplet i nästa bild visar en interaktiv visning; scatterplot visas omedelbart. I ett annat verktyg kan du behöva ytterligare steg för att utföra och skapa diagrammet.
Scatterplot-exemplet avser automatisk körsträcka till motorhästkraft. Låg hästkraft är förknippad med hög körsträcka, och ju högre hästkrafter, desto lägre körsträcka. Du kan enkelt se detta mönster i data. Du kanske märker en form, inte linjär men något krökt. Detta kan ge tips om vilka modelltyper du ska försöka senare.
Datautvinningsprogram har ofta några interaktiva funktioner i grafdisplayer. Till exempel visar nästa figur att sväva musen över en punkt visar de exakta värdena för de två variablerna för den punkten. Det här är lättare än att försöka läsa värdena från axlarna!