Innehållsförteckning:
Video: Creating Barplots in RStudio 2024
En ggplot2 geom berättar diagrammet hur du vill visa dina data i R. Till exempel använder du geom_bar () för att skapa ett stapeldiagram. I ggplot2 kan du använda en rad fördefinierade geomer för att göra vanliga typer av diagram.
En geom definierar layouten för ett ggplot2-lager. Du kan till exempel använda geom för att skapa stapeldiagram, scatterplots och linjediagram (liksom en mängd andra diagram), som du kan se nedan.
Varje geom har en standardstat, och varje stat har en standard geom. I praktiken måste du bara ange en av dessa.
Geom | Beskrivning | Standardstat |
---|---|---|
geom_bar () | Streckkarta | stat_bin () |
geom_point () | Scatterplot | stat_identity () |
geom_line () | Linjediagram, koppla iakttagelser i ordning med
x -värde |
stat_identity () |
geom_boxplot | Box-and-whisker-plot | stat_boxplot () |
geom_path | Linjediagram, anslutande observationer i originalordning | stat_identity () |
geom_smooth | Lägg till en jämn konditionerad medelvärde | stat_smooth () |
geom_histogram | Ett alias för geom_bar stat_bin () | stat_bin () |
Skapa ett stapeldiagram
För att skapa ett stapeldiagram, använder du geom_bar () -funktionen. Observera dock att standardstat är stat_bin (), som används för att skära dina data i fack. Således är standardbeteendet för geom_bar () att skapa ett histogram.
För att till exempel skapa ett histogram av djupet av jordbävningar i schakningsdatasetet, försök: >> ggplot (skakningar, aes (x = djup)) + geom_bar ()> ggplot (quakes, aes djup)) + geom_bar (binwidth = 50)
Observera att din kartläggning definierar endast
x -axisvariabeln (i detta fall djupdjup). Ett användbart argument för geom_bar () är binvidth, vilket styr storleken på rutorna som dina data är skurna in i. Detta skapar denna plot.
I nästa exempel använder du aggregat () för att beräkna antalet skakningar vid olika djuplag: >> skakningar agg = namn (quakes. agg) <- c ("djup", "mag")
Nu kan du plotta objektets skakningar. agg med geom_bar (stat = "identitet"): >> ggplot agg, aes (x = djup, y = mag)) + + geom_bar (stat = "identitet")
Sammanfattningsvis kan du använda geom_bar () för att skapa ett histogram och låt ggplot2 sammanfatta dina data, eller du kan summera dina data och använd sedan stat = "identitet" för att rita ett stapeldiagram.
Skapa en scatterplot
För att skapa en scatterplot använder du funktionen geom_point (). En scatterplot skapar poäng (eller ibland bubblor eller andra symboler) på diagrammet. Varje punkt motsvarar en observation i dina data.
Du har förmodligen sett eller skapat den här typen av grafik en miljon gånger, så du vet redan att scatterplots använder det kartesiska koordinatsystemet, där en variabel är mappad till
x
-axen och en andra variabel är mappad till
y -axen. På precis samma sätt skapar du i ggplot2 en kartläggning mellan x -axis och
y -axisvariablerna. Så, för att skapa ett diagram över skakningsdata, kartlägger du quakes $ long till x -axis och quakes $ lat till y -axis: >> ggplot, aes (x = long, y = lat)) + geom_point () Detta skapar denna scatterplot. geom_point (). "Width =" 535 "> Skapa en scatterplot med geom_point ().
Skapa linjekartor
För att skapa ett linjediagram använder du funktionen geom_line (). Du använder den här funktionen på ett mycket liknande sätt till geom_point (); skillnaden är att geom_line () drar en linje mellan på varandra följande punkter i dina data.
Denna typ av diagram är användbar för tidsseriedata i dataramar, t.ex. befolkningsdata i det inbyggda datasetet longley, aes (x = år, y = arbetslösa)) + geom_line () Detta skapar den här raden.geom_line (). "width =" 535 ">
Ritning av ett linjediagram med geom_line ().
Du kan använda antingen geom_line () eller geom_path () för att skapa en linjeteckning i ggplot2. Skillnaden är att geom_line () först beställer observationerna enligt
x
-värdet, medan geom_path () drar observationerna i den ordning som finns i data.