Video: Tutorial Membuat Grafik Regresi dan Nilai Korelasi Dengan Menggunakan MINITAB 2024
Ett histogram är ett diagram som representerar sannolikhetsfördelningen för en dataset. Ett histogram har en serie vertikala staplar där varje stapel representerar ett enskilt värde eller en rad värden för en variabel. Staplarnas höjder anger frekvenserna eller sannolikheterna för de olika värdena eller värdena.
Till exempel visar den här siffran ett histogram av de dagliga priserna på Apple-lager från 1 januari 2013 till 31 december 2013.
Enligt detta histogram var de flesta priserna mellan $ 60 och $ 65; Priset var i detta intervall 81 gånger under året. De näst vanligast observerade priserna var mellan $ 55 och $ 60; Priset landade i detta intervall 44 gånger under året. Det tredje vanligaste utbudet av priser var mellan $ 65 och $ 70, och det fjärde vanligaste priset varierade mellan $ 70 och $ 75. Mycket få priser var mellan $ 50 och $ 55, och de fåsta priserna observerades under året var mellan $ 80 och $ 85.
Medelvärdet och medianpriset var baserat på diagrammet nära $ 60 till $ 65. Själva medelvärdet var $ 65. 67, och den faktiska medianen var 63 dollar. 65. Eftersom medelvärdet överstiger medianen var prisfördelningen för 2013 positivt skevad. Detta indikerar att sannolikheten för ett extremt stort pris är något större än sannolikheten för ett extremt lågt pris.
En fördelning är positivt skevd om medelvärdet är större än medianen; det är negativt skevt om medelvärdet är mindre än medianen. Fördelningen är symmetrisk om medelvärdet om medelvärdet är lika med medianen. Hur mycket dataen är skev beror på hur långt medelvärdet och medianen skiljer sig åt. Om de är mycket nära är det ibland praktiskt att behandla fördelningen som symmetrisk.
Som ett annat exempel visar denna figur ett histogram av de dagliga priserna på S & P 500 aktieindex från 1 januari 2013 till 31 december 2013.
Histogram för dagliga priser för S & P 500.Enligt histogrammet i Figur 12-10 var det mest observerade utbudet av priser under året mellan $ 1 650 och $ 1, 700. Medelvärdet visade sig vara $ 1, 643. 80 och medianen var $ 1, 650. 41. Till skillnad från Apple-lager var medelvärdet under medianen; Prisfördelningen för 2013 är negativt skevad. Detta indikerar att det var en något större tendens för Standard och Poor's 500 att handla under genomsnittet än över genomsnittet 2013.
En av de viktigaste användningarna av histogram är att avgöra om en dataset följer en specificerad sannolikhetsfördelning.Även om det finns många formella statistiska tester för att bestämma vilken sannolikhetsfördelning en dataset följer, är det bra att visuellt inspektera data med ett diagram innan de engagerar sig i några formella statistiska test.
Histogrammet för Apple-priserna visar starkt att Apple-aktiekurserna är inte normalt distribuerade. Den normala fördelningen är symmetrisk om dess genomsnittliga, medan Apple-aktiekurserna är positivt skevade. Histogrammet för S & P-priserna ger starka bevis för att S & P 500 också sannolikt inte kommer att distribueras normalt eftersom distributionen är negativt skevad.
Formella statistiska tester skulle krävas för att visa att ingen distribution är normal, men graferna är mycket suggestiva. Eftersom många statistiska tester är baserade på antagandet om normalitet är det viktigt att avgöra om en distribution är helt normal innan du använder någon av dessa test.