Video: Biblical Series I: Introduction to the Idea of God 2024
Du har datasetet och du har formaterat det för att passa dina behov i R, så nu är du redo för det verkliga arbetet. Analysera dina data börjar alltid med att beskriva det. På så sätt kan du upptäcka fel i data, och du kan bestämma vilka modeller som är lämpliga för att få den information du behöver från de data du har.
Vilken beskrivande statistik du använder beror naturligtvis på din data.
Ibland är du mer intresserad av den allmänna bilden av dina data än du är i de enskilda värdena. Du kanske inte är intresserad av bilens körsträcka, men i den genomsnittliga körsträckan av alla bilar från datasetet. För detta beräknar du medelvärdet med hjälp av medelvärdet (), så här: >> mean (cars $ mpg) [1] 20. 09062
Du kan också beräkna det genomsnittliga antalet cylindrar dessa bilar har men det här är inte så bra. Medelvärdet skulle vara 6. 1875 cylindrar, och inga bilar kör med en ofullständig cylinder. I detta fall är
median - det mest centrala värdet i dina data - mer meningsfullt. Du får medianen från att använda funktionen median (), så här: