Video: Global Warming or a New Ice Age: Documentary Film 2024
Innan du försöker Beskriv dina data i R, du måste se till att dina data är i rätt format. Det betyder
-
Se till att alla data finns i en dataram (eller i en vektor om det är en enda variabel)
-
Se till att alla variabler är av rätt typ
-
Kontrollera att värdena alla är bearbetade korrekt
Vissa data kan bara ha ett begränsat antal olika värden. Till exempel kan människor vara antingen manliga eller kvinnliga, och du kan beskriva de flesta hårtyper med bara några färger.
Ibland är fler värden teoretiskt möjliga men inte realistiska. Till exempel kan bilar ha mer än 16 cylindrar i sina motorer, men du hittar inte många av dem. På ett eller annat sätt kan alla dessa data ses som kategoriska . Med denna definition innehåller kategoriska data också ordinära data.
Å andra sidan har du data som kan ha obegränsat antal möjliga värden. Detta betyder inte nödvändigtvis att värdena kan vara något värde du gillar. Till exempel uttrycks bilens körsträcka i miles per gallon, ofta avrundad till hela milen. Ändå kommer det verkliga värdet att vara lite annorlunda för varje bil.
Det enda som definierar hur många möjliga värden du tillåter är precisionen med vilken du uttrycker data. Data som kan uttryckas med valfri precisionsnivå är kontinuerlig . Både intervallskalad data och förhållandeskalad data är vanligtvis kontinuerliga data.
Skillnaden mellan kategoriska och kontinuerliga data är dock inte alltid tydlig. Ålder är i huvudsak en kontinuerlig variabel, men uttrycks ofta i antal år sedan födseln.
Du har fortfarande många möjliga värden om du gör det, men vad händer om du tittar på barnens ålder på din lokala gymnasium? Plötsligt har du bara fem, kanske sex olika värden i dina data. På den tiden kan du få mer ut av din analys om du behandlar den data som kategorisk.
När du beskriver dina data måste du skilja mellan data som drar nytta av att konverteras till en faktor och data som behöver vara numeriska. Om du kan se dina data som kategoriska, hjälper det att analysera den om du vill konvertera den till en faktor.