Innehållsförteckning:
- Så här får du utmatningen
- Såg du de konstiga värdena för variabelcylen? En snabb titt på sammanfattningen kan berätta att det är något fiskigt på gång, som till exempel minsta och första kvartilen har exakt samma värde. Faktum är att variabelcylen endast har tre värden och skulle vara bättre som en faktor. Så, låt oss sätta den variabeln ur elände: >> bilar $ cyl <- as. faktor (bilar $ cyl)
Video: Import Data, Copy Data from Excel to R CSV & TXT Files | R Tutorial 1.5 | MarinStatsLectures 2024
Om du behöver en snabb överblick över ditt dataset, kan du självklart alltid använda kommandot R str () och titta på strukturen. Men detta berättar dig bara om klasserna av dina variabler och antalet observationer. Funktionshuvudet () ger dig i bästa fall en uppfattning om hur data lagras i datasetet.
Så här får du utmatningen
För att få en bättre bild av fördelningen av dina variabler i datamängden kan du använda funktionen summary () så här:
Sammanfattningsfunktionen () fungerar bäst om du bara använder R interaktivt på kommandoraden för att snabbt skanna datasetet. Du bör inte försöka använda den i en anpassad funktion du skrev själv.
Numeriska variabler:
-
Sammanfattning () ger dig intervallet, kvartiler, median och medelvärde. Faktorvariabler:
-
sammanfattning () ger dig en tabell med frekvenser. Numeriska och faktorvariabler:
-
sammanfattning () ger dig antalet saknade värden, om det finns några.
-
Sammanfattning () ger dig ingen information alls bortsett från längden och klassen (vilket är 'tecken'). Så här åtgärdar du ett problem