Video: Format Rekordbox Device FAT32 [Windows 10] 2024
Människor använder erfarenhet när de tolkar de data de ser, men datorer kan inte. Din data-mining programvara kommer att göra sitt bästa för att identifiera vilken typ av data i varje kolumn, men datatyper är ofta tvetydiga.
När du ser en lista med postkoder försöker du inte lägga till och dras av dem. Du vet att de representerar platser. Du förstår detta eftersom du har mycket erfarenhet att se och känna igen postkoder. En dator kan tolka en postnummer som ett heltal eller kontinuerlig åtgärd. I slutändan är det upp till dig att definiera rätt format.
Funktioner för att ställa in dataformat och roller (som att ange den beroende variabeln för modellering) kan begravas inom en mängd olika ställen i din data mining applikation. Du kan definiera format och roll av variabler i en datafil innan du ens öppnar en data-mining ansökan (de ursprungliga dataformaten för Orange och Weka tillåter detta), som en del av importen eller någon gång senare i processen.
Du kan ha verktyg som är byggda för detta ändamål, som verktygen som visas i följande figurer, eller du kan definiera dessa egenskaper inom andra förfaranden.
Varje data-mining ansökan har sin egen uppsättning variabla typer och sina egna gränser för hur varje typ kan användas. Några av dessa gränser är teoretiskt baserade. Till exempel kan du bara lägga till och subtrahera tal, inte bokstäver. Men andra kan bara vara en fråga om hur ansökan utformades.
Så, till exempel, kan du upptäcka att ett visst modelleringsverktyg i en applikation gör att du kan förutsäga både kategoriska och kontinuerliga variabler, men ett liknande verktyg i en annan applikation kan tillåta modellering av endast en eller annan.