Video: Hur man använder Excel 2024
När du har data i högformat i R kan du enkelt använda gallerdiagram för att visualisera undergrupper i dina data. Till exempel, vad händer när du vill analysera mer än en variabel samtidigt?
Tänk på det inbyggda datasetet Longley, som innehåller data om sysselsättning, arbetslöshet och andra befolkningsindikatorer: >> str (longley) -data. ram ': 16 obs. av 7 variabler: $ BNP. deflator: num 83 88. 5 88. 2 89. 5 96. 2 … $ BNP: num 234 259 258 285 329 … $ Arbetslösa: num 236 232 368 335 210 … $ Beväpnad. Krafter: num 159 146 162 165 310 … $ Befolkning: num 108 109 110 111 112 … $ År: int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 … $ Anställd: num 60. 3 61. 1 60. 2 61. 2 63. 2 …
Ett sätt att enkelt analysera de olika variablerna i en dataram är att först omforma dataramen från bredformat till långformat.
Ett enkelt sätt att omforma en dataramm från bredformat till långformat är att använda funktionen smält () i reshape2-paketet.
Kom ihåg: reshape2 är inte en del av bas R - det är ett tilläggspaket som finns tillgängligt på CRAN. Du kan installera den med installationen. paket ("reshape2") funktionen.
De ytterligare argumenten par. remsa. text och vågar styr teckensnittstorleken (teckenförhöjningsförhållandet) för remsan längst upp i diagrammet, såväl som skalan.
När du skapar tomter med flera grupper, se till att det resulterande diagrammet är meningsfullt. Exempelvis är BNI-enheten (kort för
Bruttonationalprodukt
) troligen miljarder dollar. Däremot är befolkningsenheten troligtvis miljoner människor. (Dokumentationen för longley dataset är inte tydlig i detta ämne.)Var försiktig när du presenterar tomter så här - du vill inte bli anklagad för att skapa grafisk skräp (vilseledande grafik).