Hem Personliga finanser Hur man använder Suss-statistik i ggplot2 i R-dummies

Hur man använder Suss-statistik i ggplot2 i R-dummies

Innehållsförteckning:

Video: Data Analysis in R by Dustin Tran 2024

Video: Data Analysis in R by Dustin Tran 2024
Anonim

Efter data, kartläggning och geom beskriver det fjärde elementet i ett ggplot2-lager i R hur data ska sammanfattas. I ggplot2 hänvisar du till den här statistiska sammanfattningen som en stat.

En mycket bekväm egenskap hos ggplot2 är dess utbud av funktioner för att sammanfatta dina data i diagrammet. Det innebär att du ofta inte behöver sammanfatta dina data. Exempelvis anger höjden på staplarna i ett histogram hur många observationer av något du har i dina data. Den statistiska sammanfattningen för detta är att räkna observationerna. Statistiker hänvisar till denna process som binning, och standardstat för geom_bar () är stat_bin ().

Analogt med hur varje geom har en associerad standardstat har varje stat också en standard geom.

Så, det här frågar: Hur bestämmer du om du ska använda en geom eller en stat? I teorin spelar ingen roll om du väljer geom eller stat först. I praktiken är det emellertid ofta intuitivt att börja med en typ av plot först - med andra ord ange en geom. Om du sedan vill lägga till ett annat lager av statistisk sammanfattning, använd en stat.

geom_bar (). "Width =" 535 ">

Gör ett histogram med geom_bar ().

I denna plot användes samma data för att först skapa en scatterplot med geom_point () och sedan lade du till en jämn linje med stat_smooth

Här följer några praktiska exempel på att använda statsfunktioner.

Stat Beskrivning Standard Geom
stat_bin () Räknar antalet observationer i rutor. geom_bar ()
stat_smooth () Skapar en jämn linje. geom_line ()
stat_sum () Lägger till värden. geom_point ()
stat_identity () Ingen sammanfattning. geom_point ()
stat_boxplot () Sammanfattar data för en box-and-whisker plot. geom_boxplot ()
> Binning data

Du har redan sett hur du använder stat_bin () för att sammanfatta dina data i rutor, eftersom det här är standardstat för geom_bar (). Det innebär att följande två kodkod ger samma diagram: >> ggplot (quakes, aes (x = djup)) + geom_bar (binwidth = 50)> ggplot (quakes, aes (x = djup)) + stat_bin (binwid th = 50)

Utjämningsdata

Paketet ggplot2 gör det också mycket enkelt att skapa regressionslinjer via dina data. Du använder funktionen stat_smooth () för att skapa denna typ av linje.

Det intressanta med stat_smooth () är att det använder sig av lokal regression som standard. R har flera funktioner som kan göra detta, men ggplot2 använder funktionen Loess () för lokal regression. Detta innebär att om du vill skapa en linjär regressionsmodell måste du berätta stat_smooth () för att använda en annan mjukare funktion.Du gör detta med metodargumentet.

För att illustrera användningen av en jämnare, börja med att skapa en spridd plot av arbetslöshet i longley dataset: >> p p

Nästa, lägg till en mjukare. Det här är lika enkelt som att lägga till stat_smooth () i din kodrad. >> p + stat_smooth ()

Din grafik ska se ut som diagrammet till vänster om bilden nedan.

Ibland genererar ggplot2 meddelanden med extra tips och information. Så länge du inte ser varning eller fel kan du säkert ignorera dessa meddelanden. I det här fallet anger stat_smooth () att standardmjukare är en metod som heter

Loess

(lokal utjämning). Meddelandet säger också att du kan använda alternativa utjämningsmetoder.

Använd slutligen stat_smooth () för att passa och rita en linjär regressionsmodell. Du gör detta genom att lägga till argumentmetoden = "lm": >> p + stat_smooth (metod = "lm")

Din grafik ska nu se ut som plottet till höger. stat_smooth (). "Width =" 535 "> Lägga till regressionslinjer med stat_smooth ().

Göra ingenting med identitet

Ibland vill du inte att ggplot2 sammanfattar dina data i diagrammet. Det händer vanligtvis när dina data är redan i förväg sammanställd eller när varje rad i din dataram ska avbildas separat. I dessa fall vill du berätta för ggplot2 att ingenting gör alls, och staten att göra detta är stat_identity (). Du har säkert märkt att stat_identity är standardstatistik för punkter och rader.
Hur man använder Suss-statistik i ggplot2 i R-dummies

Redaktörens val

Hur man justerar inställningar för din bakgrund i Gamestar Mechanic - dummies

Hur man justerar inställningar för din bakgrund i Gamestar Mechanic - dummies

När du har lagt till en Bakgrund till ditt spel kan du ytterligare anpassa bakgrunden i Gamestar Mechanic genom att använda två ytterligare alternativ i dialogrutan Nivåinställningar: Bakgrundsrullning och Bakgrundsstil. Bakgrundsrullning Parallaxen är en viktig egenskap hos bakgrunden i spel där alternativet Fler skärm är valt. Redigerbar ...

Hur man balanserar svårigheten hos ett Gamestar Mechanic Game - dummies

Hur man balanserar svårigheten hos ett Gamestar Mechanic Game - dummies

Det vanligaste exemplet på balansering ett spel i Gamestar Mechanic balanserar svårigheten: Gör inte spelet så lätt att det är tråkigt och gör det inte så svårt att det är frustrerande. För att finjustera spelets svårighet måste du göra små förändringar utan att bli förbunden till ...

För att kalibrera accelerometern för ditt HTML5-spel - dummies

För att kalibrera accelerometern för ditt HTML5-spel - dummies

Som standard antar HTML5-spelaccelerometern Det neutrala läget är perfekt horisontellt - det vill säga enheten ligger platt på ett bord. Men det här är mobila enheter, och spelare vill ofta ha det neutrala stället att vara någon annanstans. Grundläggande tekniken för att kalibrera tiltkontrollen är att hålla koll på en ...

Redaktörens val

Gör äta rena förändringar i livet - dummies

Gör äta rena förändringar i livet - dummies

Rena ätförändringar i ditt liv är inte svåra att göra, men de tar lite gumption, uthållighet och övning. När du gör en koncentrerad insats för att äta lägre på livsmedelskedjan, märka hur detta beslut påverkar andra delar av ditt liv. För att vara framgångsrik måste du tänka på mat och äta annorlunda, vilka ...

Köttfri måndag och hållbarhet - dummies

Köttfri måndag och hållbarhet - dummies

Köttfri måndag är ett ganska nytt koncept som ofta nämns på Facebook och Twitter. Allt det betyder är att en dag i veckan väljer du att äta vegetarian eller vegan. Inte bara kan Meatless Monday spara pengar (eftersom kött är dyrt), men planen hjälper miljön (eftersom stora kött-, fläsk- och kycklingsanläggningar skapar nitrat ...

5 Hälsofördelar Kopplade till Medelhavsdiet - dummies

5 Hälsofördelar Kopplade till Medelhavsdiet - dummies

Medelhavsdieten har länge varit prydnad för vilket ger hälsoeffekter, såsom att minska kranskärlssjukdom och minska risken för vissa cancerformer. Inklusive färska grönsaker och frukter, baljväxter och hälsosamma fetter i din kost kan hjälpa dig att förbättra din hälsa på många sätt. Forskning visar att en traditionell medelhavsdiet minskar ...

Redaktörens val

Hur man arbetar med Nikon D3300-minneskort - dummies

Hur man arbetar med Nikon D3300-minneskort - dummies

Som mediet som lagrar dina bildfiler , Nikon D3300s minneskort är en viktig del av din kamera. Följ dessa tips för att köpa och behålla kort: Köpkort: När du handlar för ett SD-minneskort är den enda specifikationen som noterar annat än kortkapaciteten kort hastighet, vilket indikerar hur snabbt data ...

Timerfotografering: Nikon D5200-dummies med Nikon D5200

Timerfotografering: Nikon D5200-dummies med Nikon D5200

Med intervall Timer Fotografering på Nikon D5200, du kan ställa in kameran för att automatiskt släppa avtryckaren med intervall som sträcker sig från sekunder till timmar från varandra. Med den här funktionen kan du fånga upp ett ämne eftersom det förändras över tiden - en teknik som är känd som fotografering med tidsfördröjning - utan att behöva stå runt på ...

JPEG Filer på Nikon D3300-dummies

JPEG Filer på Nikon D3300-dummies

Uttalad "jay-peg", det här formatet är standardinställningen på din Nikon D3300, som det är på de flesta digitalkameror. JPEG är populär av två huvudorsaker: Omedelbar användbarhet: Alla webbläsare och e-postprogram kan visa JPEG-filer, så att du kan dela bilder online direkt efter att du har tagit dem. Du kan också få en ...