Innehållsförteckning:
- Så här skapar du en densitetsplot
- Så, i stället för att räkna upp räkningarna i histogrammet, kan du lika bra plotta densiteterna. R gör alla beräkningar för dig - det enda du behöver göra är att ställa in freq-argumentet för hist () till FALSE, så här: >> hist (bilar $ mpg, col = "grå", freq = FALSE)
Video: How X-rays see through your skin - Ge Wang 2024
Förlorar du fortfarande information i intervaller i R. Ändå är det mest kompletta sättet att beskriva dina data genom att uppskatta sannolikhetsdensitetsfunktionen (PDF) eller densitet av din variabel.
Om detta koncept är obekant för dig, oroa dig inte. Kom bara ihåg att densiteten är proportionell mot chansen att något värde i dina data är ungefär lika med det värdet. Faktum är att för ett histogram beräknas densiteten utifrån räkningarna, så den enda skillnaden mellan ett histogram med frekvenser och ett med densiteter är skalan av y -axen. För resten ser de exakt samma ut.
Så här skapar du en densitetsplot
Du kan beräkna densitetsfunktionen för en variabel med funktionen density (). Utgången från den här funktionen säger dig inte så mycket, men du kan enkelt använda den i en plot. Till exempel kan du få tätheten av körsträckan variabel mpg så här: >> mpgdens <- density (cars $ mpg)
Objektet du får här är en lista som innehåller mycket information du inte gör verkligen behöver titta på. Men den här listan gör att tätheten är lika enkel som att säga "plotta densiteten":
x
-axen och densiteten på y -axen. Listobjektet mpgdens innehåller bland annat ett element som heter x och en som heter y. Dessa representerar x
- och y -koordinaterna för att plotta densiteten. När R beräknar densiteten, delar densiteten () -funktionen upp dina data i ett antal små intervall och beräknar densiteten för mittpunkten för varje intervall. Dessa mittpunkter är värdena för x, och de beräknade densiteterna är värdena för y.
Så, i stället för att räkna upp räkningarna i histogrammet, kan du lika bra plotta densiteterna. R gör alla beräkningar för dig - det enda du behöver göra är att ställa in freq-argumentet för hist () till FALSE, så här: >> hist (bilar $ mpg, col = "grå", freq = FALSE)
Nu kommer tomten att se exakt ut som tidigare; endast värdena på
y
-axen är olika.Skalan på
y -axan är inställd så att du kan lägga till densitetsplot över histogrammet. Därför använder du linjerna () -funktionen med densitetsobjektet som argumentet. Så kan du till exempel fira upp det tidigare histogrammet lite längre genom att lägga till den beräknade densiteten med följande kod direkt efter det föregående kommandot: >> linjer (mpgdens) Du ser resultatet av dessa två kommandon på höger sida. Kom ihåg att rader () använder x- och y-elementen från densitetsobjektet mpgdens för att plotta linjen.