Innehållsförteckning:
- Beskrivande statistik är enkel
- Medelvärden är inte så enkla ibland
- Observation
- A
- Om man tittar på ett urval av värden från en population och provet är representativt och tillräckligt stort kan man dra slutsatser om befolkningen utifrån provets egenskaper.
- P
- A
- Ett par andra användbara statistiska termer som är kända är skevhet och kurtosis.
- Sannolikheter förvirrar ofta människor. En viktig sak att förstå om konfidensnivåer är att de är kopplade till felmarginalen.
Video: Excel Tutorial - Beginner 2024
Excel är ett underbart verktyg när du behöver använda statistik. Om du aldrig har blivit utsatt för statistik i skolan eller det har varit ett decennium eller två sedan du var, låt dessa tips hjälpa dig att använda några av de statistiska verktyg som Excel tillhandahåller.
Beskrivande statistik är enkel
Det första du borde veta är att någon statistisk analys och några statistiska åtgärder är ganska darna enkelt. Beskrivande statistik, som inkluderar saker som pivottabellens tabuleringar, liksom några av de statistiska funktionerna, är vettigt även för någon som inte är så kvantitativ.
Medelvärden är inte så enkla ibland
När någon använder termen genomsnitt, är det vanligaste medeltalet, som är en betyda. Förstå att termen genomsnittlig är oklar gör mycket av Excels statistiska funktionalitet mer begriplig.
För att göra denna diskussion mer konkret, anta att du tittar på en liten uppsättning värden: 1, 2, 3, 4 och 5. Som du kanske vet är medelvärdet i denna lilla uppsättning värden 3. Du kan beräkna medelvärdet genom att lägga till samtliga siffror i uppsättningen (1 + 2 + 3 + 4 + 5) och sedan dela denna summa (15) med det totala antalet värden i uppsättningen (5).
Medianvärdet är det värde som skiljer de största värdena från de minsta värdena. I dataset 1, 2, 3, 4 och 5 är medianen 3. Värdet 3 skiljer de största värdena (4 och 5) från de minsta värdena (1 och 2). Du behöver inte förstå olika genomsnittliga mätningar, men du bör komma ihåg att termen
genomsnittlig är ganska osäkert. Standardavvikelser beskriver dispersion
A
standardavvikelse beskriver hur värdena i en dataset varierar runt genomsnittet. Den snygga saken om statistiska åtgärder som en standardavvikelse, får du ofta inblick i egenskaperna hos de data du tittar på. En annan sak är att med dessa två bitar av data kan du ofta dra slutsatser om data genom att titta på prover. En observation är en observation
Observation
är en av de villkor som du kommer att stöta på om du läser något om statistik. En observation är bara en observation. Ett sätt att definiera termen observation är så här: När du faktiskt tilldelar ett värde till en av dina slumpmässiga variabler skapar du en observation. Ett prov är en delmängd av värden
A
prov är en samling observationer från en population. Om du till exempel skapar en dataset som registrerar den dagliga hög temperaturen i ditt grannskap är din lilla samling observationer ett urval. I jämförelse är ett prov inte en population. En
befolkning innehåller alla möjliga observationer. Inferentiell statistik är cool men komplicerad
Om man tittar på ett urval av värden från en population och provet är representativt och tillräckligt stort kan man dra slutsatser om befolkningen utifrån provets egenskaper.
Inferentiell statistik, trots att den är mycket kraftfull, har två egenskaper som du behöver veta:
Noggrannhetsproblem
-
Brant inlärningskurva
-
Fördelningsfunktioner är inte alltid förvirrande
P
funktionen låter ganska knepig; men du kan faktiskt förstå intuitivt vad en sannolikhetsfördelningsfunktion är med ett par användbara exempel. En vanlig fördelning som du hör om i statistikklasser, till exempel, är en T-fördelning. En
T-fördelning är i huvudsak en normal fördelning förutom med tyngre, fylligare svansar. En gemensam sannolikhetsfördelning är en enhetlig fördelning. I en
enhetlig fördelning, har varje händelse samma sannolikhet för förekomst. Det unika med denna fördelning är att allt är ganska darn nivå. En annan vanlig typ av sannolikhetsfördelning är
normalfördelning, , även känd som en bellkurva eller en Gaussisk fördelning. En normal fördelning sker naturligt i många situationer. Till exempel distribueras intelligens kvoter (IQ) normalt.
Parametrar är inte så komplicerade
A
parameter är en ingång till sannolikhetsfördelningsfunktionen. Med andra ord behöver formeln eller funktionen eller ekvationen som beskriver en sannolikhetsfördelningskurva inmatningar. I statistiken kallas dessa ingångar parametrar. Vissa sannolikhetsfördelningsfunktioner behöver bara en enda enkel parameter. Till exempel, för att arbeta med en enhetlig fördelning, behöver du bara antalet värden i datasatsen. En sexsidig dö har till exempel bara sex möjligheter.
Skewness och kurtosis beskriver en sannolikhetsfördelningens form
Ett par andra användbara statistiska termer som är kända är skevhet och kurtosis.
Skewness kvantifierar brist på symmetri i en sannolikhetsfördelning. I en perfekt symmetrisk fördelning, som den normala fördelningen, är skäheten lika med noll. Om en sannolikhetsfördelning lutar till höger eller vänster är skäven likvärdig med något annat värde än noll, och värdet kvantifierar symmetribristen. Kurtosis
kvantifierar svärdet av svansarna i en fördelning. I en normal fördelning är kurtosis lika med noll. svansen är den sak som når ut till vänster eller höger. Om en svans i en fördelning är tyngre än en normal fördelning är kurtosen ett positivt tal.Om svansarna i en fördelning är skinnigare än i en normal fördelning är kurtosis ett negativt tal. Förtroendeintervall verkar komplicerade först, men är användbara
Sannolikheter förvirrar ofta människor. En viktig sak att förstå om konfidensnivåer är att de är kopplade till felmarginalen.
En annan viktig sak att förstå om konfidensnivåer är att ju större du gör din samplingsstorlek desto mindre kommer din felmarginal att använda samma konfidensnivå.
Som ett exempel, säg att du hade några Google Analytics-data om två olika webbannonser som du kör för att marknadsföra ditt lilla företag, och du vill veta vilken annons som är effektivare. Du kan använda konfidensintervallformeln för att ta reda på hur länge dina annonser måste köras innan Googles samlade data är tillräckliga för att du ska kunna veta vilken annons som är riktigt bättre.