Hem Personliga finanser Hur mycket sprids finns i data? - dummies

Hur mycket sprids finns i data? - dummies

Video: Joel Selanikio: The surprising seeds of a big-data revolution in healthcare 2025

Video: Joel Selanikio: The surprising seeds of a big-data revolution in healthcare 2025
Anonim

När du arbetar med stor datastatistik identifierar du spridningen av ett dataset från mitten med flera olika sammanfattande åtgärder: varians, standard avvikelse, kvartiler, interkvartilintervall (IQR).

Varians är den genomsnittliga kvadratiska avvikelsen mellan elementen i datasetet och medelvärdet. För ett urval av data beräknas variansen så här:

där

  • x i är värdet av ett enda element i provet.

  • är provvärdet.

  • n är provstorleken.

Standardavvikelsen är kvadratroten av variansen. För de flesta tillämpningar är standardavvikelsen mer användbar än variansen som ett mått på spridning. Det beror på att variationen mäts i kvadrerade enheter, medan standardavvikelsen mäts i samma enheter som data. Till exempel skulle variansen av en dataset som består av priser mäts i dollar kvadratisk och standardavvikelsen skulle mätas i dollar. Standardavvikelse är den mest använda mätningen av spridningen i en dataset.

Quartiles delar en dataset i fyra lika delar. Den första kvartilen (Q 1 ) delar upp data i den lägsta 25 procent av observationerna och den högsta 75 procenten (25 procent av observationerna är mindre än Q 1 < och 75 procent är större än Q 1 ). Den andra kvartilen (Q 2 ) delar upp data till den lägsta 50 procent av observationerna och högst 50 procent. Den tredje kvartilen (Q 3 ) delar upp data till den lägsta 75 procent av observationerna och högst 25 procent. Interkvartilintervallet (IQR) är lika med skillnaden mellan den tredje och den första kvartilen:

IQR representerar mitten av 50 procent av data.

Kvartilerna i en dataset illustreras bäst med en

ruttsplot. Följande bild visar en ruttsplot av de dagliga avkastningarna till ExxonMobil 2013. Boxdiagram över dagliga avkastningar till ExxonMobil-aktien 2013.

I rutan visar flera nyckelstatistik för ExxonMobil-avkastningen: > Minsta avkastning visas på ett diagram som en enda punkt längst ner i diagrammet (en ruta visar

utestängningar

som enskilda poäng). Q 1 visas som botten av lådan, Q 2 är den solida svarta linjen i mitten av lådan och Q 3 är toppen av lådan. Den maximala avkastningen visas som en enda punkt högst upp i diagrammet.

Hur mycket sprids finns i data? - dummies

Redaktörens val

Hur man skapar en webbplats i Dreamweaver - dummies

Hur man skapar en webbplats i Dreamweaver - dummies

Definierar en Dreamweaver-webbplats mer smidigt om du har filer du planerar att använda på din webbplats organiserade i en mapp - med, om du vill, undermappar för bilder, video och kanske andra element som ljud. Med dina filer separerade i en organiserad mappstruktur är du redo att definiera en Dreamweaver-webbplats. ...

Hur man skapar en HTML-sida med Dreamweavers nya dokumentfönster - dummies

Hur man skapar en HTML-sida med Dreamweavers nya dokumentfönster - dummies

Du kan skapa en HTML-sida ny HTML-sida genom att använda Dreamweaver's New Document-fönstret, som erbjuder fler alternativ än Välkommen-skärmen, inklusive tillgång till alla mallar du har skapat med Dreamweaver, samt en samling av förutformade layouter, vilket kan ge dig en början på dina design. Du kan skapa många typer av filer ...

Hur man skapar en layout med en kolumn i Dreamweaver - dummies

Hur man skapar en layout med en kolumn i Dreamweaver - dummies

Innan du dyka in för att skapa en komplicerad vätskegriddesign i Dreamweaver, överväg att prova en enklare. Börja med att skapa en enkel vätskegridlayout med en kolumn, följ dessa enkla instruktioner: Välj Arkiv → Nytt. Fönstret Ny dokument öppnas. Obs! Se till att du har slutfört installationsprocessen innan du börjar arbeta med en ny vätska ...

Redaktörens val

Hur man använder Urklippspanel i Excel 2010 - dummies

Hur man använder Urklippspanel i Excel 2010 - dummies

Office Urklipp kan lagra flera nedskärningar och kopior från alla Microsoft Office-program som körs under Windows, inte bara Excel 2010. I Excel betyder det att du kan fortsätta klistra in saker från Office Clipboard i en arbetsbok även efter avslutad flyttning eller kopiering. Använd följande tekniker för att arbeta med ...

Hur man använder referensfunktioner i Excel 2016 - dummies

Hur man använder referensfunktioner i Excel 2016 - dummies

Referensfunktionerna i Excel 2016 på Lookup & Reference Kommandoknappens rullgardinsmeny på Formulas-fliken i bandet är utformad för att specifikt hantera olika aspekter av cellreferenser i arbetsbladet. Denna grupp av funktioner inkluderar: ADRESS för att returnera en cellreferens som en textinmatning i en cell i ...

Hur man använder Sparklines i Excel 2016 - dummies

Hur man använder Sparklines i Excel 2016 - dummies

Excel 2016 stöder en speciell typ av informationsgrafik kallad sparkline som representerar trender eller variationer i samlade data. Sparklines är små grafer i allmänhet om storleken på texten som omger dem. I Excel 2016 är kalkylblad höjden på kalkylbladscellerna, vars data de representerar och kan vara någon av de ...

Redaktörens val

Hur man undviker analysfel på Miller Analogies Test - dummies

Hur man undviker analysfel på Miller Analogies Test - dummies

Miller Analogies Testwriters är bra på att komponera frågor som är subtilt utformade för att lura dig. Du kan undvika vanliga analogfällor på MAT, om du har en plan för attack och en metod för att lösa dem. I allmänhet är den senare frågan i MAT, desto mer sannolikt är det ...

Hur man registrerar sig för MAT (Miller Analogies Test) - dummies

Hur man registrerar sig för MAT (Miller Analogies Test) - dummies

Efter att ha beslutat att ta Miller Analogies Test (MAT), du måste hitta en plats att faktiskt ta provet. Mer än 600 CTC, eller kontrollerade testcenter, administrerar matvaran i hela USA och Kanada, och även utomlands. För att hitta ett testcenter, gå till Miller Analogies Test-webbplatsen och leta efter en ...