Video: How to Use Pandas read_csv & to_csv 2024
En av de enklaste och mest tillförlitliga sätt att få data till R är att använda textfiler, särskilt CSV-filer (kommatecken). CSV-filformatet använder kommatecken för att skilja de olika elementen i en rad och varje rad av data finns i sin egen rad i textfilen, vilket gör CSV-filer idealiska för att representera tabelldata.
Den extra fördelen med CSV-filer är att nästan alla dataprogram stöder export av data till CSV-format. Detta gäller för de flesta kalkylbladsprogram, inklusive Microsoft Excel och OpenOffice Calc.
I följande exempel antar du att du har en CSV-fil lagrad i en bekväm mapp i ditt filsystem. Om du vill konvertera ett Excel-kalkylblad till CSV-format måste du välja Arkiv → Spara som, vilket ger dig möjlighet att spara filen i olika format.
Tänk på att en CSV-fil bara kan representera ett enda arbetsblad i ett kalkylblad. Slutligen var noga med att använda den översta raden av ditt arbetsblad (rad 1) för kolumnrubrikerna.
I R använder du läsningen. csv () -funktionen för att importera data i CSV-format. Den här funktionen har ett antal argument, men det enda viktiga argumentet är filen, som anger plats och filnamn. Att läsa en fil som heter element. csv som ligger vid f: använd läsning. csv () med fil. sökväg: >> element str (element) 'data. ram ": 10 obs. av 9 variabler: $ Atomic. antal: int 1 2 3 4 5 6 7 8 9 10 $ Namn: Faktor med 10 nivåer "Beryllium", "Bor", …: 6 5 7 1 2 3 9 10 4 8 $ Symbol: Faktor med 10 nivåer " B "," Be "," C "," F ", …: 5 6 7 2 1 3 8 10 4 9 $ Grupp: int 1 18 1 2 13 14 15 16 17 18 $ Period: int 1 1 2 2 2 2 2 2 2 2 $ Block: Faktor w / 2 nivåer "p", "s": 2 2 2 2 1 1 1 1 1 1 $ State. på. STP: Faktor w / 2 nivåer "Gas", "Solid": 1 1 2 2 2 2 1 1 1 1 $ Förekomst: Faktor w / 1 nivå "Primordial": 1 1 1 1 1 1 1 1 1 1 $ Beskrivning: Faktor w / 6 nivåer "Alkalimetaller", …: 6 5 1 2 4 6 6 6 3 5
R importerar data till en dataram. Som du kan se har detta exempel tio observationer av nio variabler.
Detta standardalternativ för att konvertera strängar till faktorer när du använder läsning. bordet () kan vara en källa till stor förvirring. Du är ofta bättre att importera data som innehåller strängar på ett sådant sätt att strängarna inte konverteras faktorer, men förblir teckenvektorer.För att importera data som innehåller strängar, använd argumentet stringsAsFactors = FALSE för att läsa. csv () eller läs. tabell ():