Innehållsförteckning:
- Hur man använder sammanslagning för att hitta korsningen av data
- Funktionen Merge () gör det möjligt att kombinera data på fyra sätt:
- Återgå till exemplen på amerikanska stater, för att utföra en fullständig sammanfogning av kalla och stora stater, använd sammanslagning och ange alla = SANT: >> slå samman stater, stora stater, alla = SANN) Namn Frostområde 1 Alaska 152 566432 2 Arizona NA 113417 3 Kalifornien NA 156361 … 13 Texas NA 262134 14 Vermont 168 NA 15 Wyoming 173 NA
Video: Data Analysis in R by Dustin Tran 2024
I R använder du funktionen Merge () för att kombinera datarammer. Den här kraftfulla funktionen försöker identifiera kolumner eller rader som är gemensamma mellan de två olika dataramarna.
Hur man använder sammanslagning för att hitta korsningen av data
Den enklaste formen av sammanslagning () finner skärningen mellan två olika datamängder. Med andra ord, för att skapa en dataram som består av de stater som är kalla och stora använder du standardversionen av sammanslagning ():
Om du är bekant med en databas språk som SQL, kan du ha gissat att slå samman () är mycket lik en databasförening. Det här är faktiskt fallet och de olika argumenten för att slå samman () gör att du kan utföra naturliga sammanfogningar, såväl som vänster, höger och fulla yttre förbindelser.
x
-
: En dataram. y
-
: En dataram. vid
-
, av. x , av. y : Namnen på kolumnerna som är gemensamma för både x och y. Standarden är att använda kolumnerna med vanliga namn mellan de två datarammerna.
-
: Logiska värden som anger typen av sammanslagning. Standardvärdet är alla = FALSE (vilket innebär att endast matchande rader returneras). Den sista gruppen av argument - allt, allt. x och alla. y - förtjänar en del förklaring. Dessa argument bestämmer vilken typ av sammanfogning som kommer att hända.
Hur man förstår de olika typerna av sammanfogning
Funktionen Merge () gör det möjligt att kombinera data på fyra sätt:
Naturligt sammanfogning:
-
Om du bara vill behålla rader som matchar dataramarna anger du argumentet alla = FALSE. Full yttre anslutning:
-
För att hålla alla rader från båda datarammerna, ange alla = SANT. Vänster yttre anslutning:
-
Om du vill inkludera alla rader i din dataramm x och bara de från y som matchar anger du allt. x = SANT. Höger yttre anslutning:
-
Om du vill inkludera alla rader i din dataramm y och bara de från x som matchar anger du allt. y = SANT. Hur man hittar facket (full yttre anslutning)
Återgå till exemplen på amerikanska stater, för att utföra en fullständig sammanfogning av kalla och stora stater, använd sammanslagning och ange alla = SANT: >> slå samman stater, stora stater, alla = SANN) Namn Frostområde 1 Alaska 152 566432 2 Arizona NA 113417 3 Kalifornien NA 156361 … 13 Texas NA 262134 14 Vermont 168 NA 15 Wyoming 173 NA
Båda dataramar har en variabel Namn, så R matchar fallen baserat på staternas namn.Variabeln Frost kommer från dataskärmen kallt. stater och det variabla området kommer från dataramen stor. stater.
Observera att detta utför den fullständiga sammanfogningen och fyller kolumnerna med NA-värden där det inte finns några matchande data.