Video: Datavärdskapet för oceanografi och marinbiologi - Ladda ner data 2024
Den dataset vi analyserar för att göra en förutsägelse är Seeds dataset, som finns i UCI-maskinlärningsförvaret. Denna dataset har 210 observationer och 7 attribut plus etiketten. Etiketten är det förväntade resultatet och används för att träna och utvärdera noggrannheten i den prediktiva modellen.
Resultatet som du försöker förutsäga är vilken typ av frö det är (attribut 8), med tanke på värdena på de sju attributen. De tre möjliga värdena för fröetypen är märkta 1, 2 och 3, och representerar Kama, Rosa och Kanadensiska sorter av vete.
De attribut i kolumnordningen de tillhandahålls:
-
område
-
omkrets
-
kompaktitet
-
längd av kärnan
-
bredd av kärnan
-
asymmetrikoefficient > Kärnspårets längd
-
Veteklass
-
För att hämta datasetet från UCI-arkivet och ladda det i minnet skriver du följande kommando i konsolen:
Du ser det Datasetet laddades i minnet som datagränsvariabelnfrön,
genom att titta på din arbetsfältpanel (högst upp till höger). Klicka på variabeln frön för att se datavärdena i källan