A stam- och bladplot en grafisk enhet där fördelningen av en dataset organiseras av det numeriska värdet av observationerna i datasetet. Diagrammet består av en "stam", som visar de olika kategorierna i data och ett "blad" som visar värdena för de enskilda observationerna i datasetet.
Till exempel är följande ett stam-och-blad-diagram för de dagliga priserna på Microsoft-lager från 1 januari 2013 till 31 december 2013. Priserna varierar från 25 dollar. 16 till $ 38. 14:
På stam- och bladplotten representerar varje rad en enda kategori; för denna dataset är varje kategori en dollarbelopp. Till exempel består kategorin 32 av alla priser mellan $ 32. 00 och $ 32. 99. Varje pris för Microsoft-aktier är citerat i dollar och cent. På vänster sida av baren visas dollar (stjälkarna); höger sida av baren visar centen (bladen), efter avrundning till närmaste 10 cent. Till exempel ett pris på $ 32. 23 är avrundad till 32 dollar. 20, och detta verkar som ett 2 på höger sida av fältet för kategorin 32. Ett pris på $ 33. 48 är avrundad till 33 dollar. 50; detta verkar som en 5 på höger sida av fältet för kategorin 33.
Med hjälp av denna teknik är det lätt att se hur många priser som faller in i varje kategori. Till exempel fanns det 14 handelsdagar i datasetet där priset på Microsoft-lager var mellan 25 dollar. 00 och $ 25. 99. Det fanns tre handelsdagar där priset på Microsoft-lager var mellan 29 dollar. 00 och $ 29. 99. Ett pris mellan $ 33. 00 och $ 33. 99 inträffade oftast och ett pris mellan 38 dollar. 00 och $ 38. 99 var den mest sällsynta under året.
Ett av fördelarna med ett stam- och bladdiagram är att det är lätt att identifiera -läget i en dataset. (Kom ihåg att läget är det värde som oftast förekommer i en dataset.) Om du bara tittar på dollarområdena är det enkelt att se vilket intervall som innehåller de flesta observationerna - den med det längsta bladet. I det här fallet skulle ett pris i 33-serien (33: 00- $ 33,99) anses vara mode eftersom det innehåller de flesta observationerna.
En annan fördel med detta diagram är att outliers är lätta att upptäcka. En outlier är en observation i en dataset som är signifikant större eller mindre än de andra observationerna i datasetet. En outlier skulle anges med ett stort gap mellan antingen den första eller sista stammen och nästa närmaste.(Kapitel 10 talar mer om outliers.)
En nackdel med stam-och-bladdiagram är att de blir svåra att tolka för stora datamängder eftersom bladets storlek blir otrygg.