Innehållsförteckning:
- Så här jämför du två dataprover
- I de flesta fall vill du inte jämföra två prov med varandra, men jämföra ett prov med ett teoretiskt prov som kommer från en viss fördelning (till exempel den normala fördelningen).
Video: HUR ANVÄNDER MAN?! 2024
Histogrammen lämnar mycket för betraktarens tolkning. Ett bättre grafiskt sätt i R för att berätta om din data distribueras normalt är att titta på en så kallad quantile-quantile (QQ) plot.
Med denna teknik plottar du kvantiler mot varandra. Om du jämför två exempel, jämför du helt enkelt kvantilerna för båda proven. Eller för att uttrycka det lite annorlunda, gör R följande för att konstruera en QQ-plot:
-
Det sorterar data för båda proverna.
-
Det kartlägger dessa sorterade värden mot varandra.
Om båda proverna inte innehåller samma antal värden beräknar R extra värden genom interpolering för det minsta provet för att skapa två prover av samma storlek.
Så här jämför du två dataprover
Du behöver självklart inte göra det själv, du kan helt enkelt använda funktionen qqplot () för det. Så, för att kontrollera om temperaturerna under aktivitet och under vila fördelas lika, gör du helt enkelt följande:
Detta skapar en plot där de beställda värdena ritas mot varandra.
Mellan ruta parentes kan du använda en logisk vektor för att välja de fall du vill ha. Här väljer du alla fall där variabel-aktivet är lika med 1 för det första provet och alla fall där variabeln är lika med 0 för det andra provet.
I de flesta fall vill du inte jämföra två prov med varandra, men jämföra ett prov med ett teoretiskt prov som kommer från en viss fördelning (till exempel den normala fördelningen).
För att göra en QQ-plot så har R den speciella qqnorm () -funktionen. Som namnet antyder, plottar denna funktion ditt prov mot en normal fördelning. Du ger helt enkelt det prov du vill plotta som ett första argument och lägga till några grafiska parametrar du gillar.
R skapar sedan ett prov med värden som kommer från normalfördelningen
standard eller en normal fördelning med ett medelvärde av noll och en standardavvikelse på en. Med detta andra prov skapar R QQ-diagrammet som förklarats tidigare. R har också en qqline () -funktion, som lägger till en rad i din normala QQ-plot. Denna linje gör det mycket lättare att utvärdera om du ser en klar avvikelse från normalitet. Ju närmare alla punkter ligger till linjen, ju närmare distributionen av ditt prov kommer till den normala fördelningen. Funktionen qqline () tar också provet som ett argument.
Nu vill du göra detta för temperaturen under både den aktiva och inaktiva perioden av bävern. Du kan använda funktionen qqnorm () två gånger för att skapa båda diagrammen. För de inaktiva perioderna kan du använda följande kod: >> qqnorm (beaver2 $ temp [beaver2 $ aktiv == 0], huvud = "Inaktiv")> qqline (beaver2 $ temp [beaver2 $ aktiv == 0])
Du kan göra samma för den aktiva perioden genom att ändra värdet 0 till 1.