Hem Personliga finanser Hur mycket sprids finns i data? - dummies

Hur mycket sprids finns i data? - dummies

Video: Joel Selanikio: The surprising seeds of a big-data revolution in healthcare 2025

Video: Joel Selanikio: The surprising seeds of a big-data revolution in healthcare 2025
Anonim

När du arbetar med stor datastatistik identifierar du spridningen av ett dataset från mitten med flera olika sammanfattande åtgärder: varians, standard avvikelse, kvartiler, interkvartilintervall (IQR).

Varians är den genomsnittliga kvadratiska avvikelsen mellan elementen i datasetet och medelvärdet. För ett urval av data beräknas variansen så här:

där

  • x i är värdet av ett enda element i provet.

  • är provvärdet.

  • n är provstorleken.

Standardavvikelsen är kvadratroten av variansen. För de flesta tillämpningar är standardavvikelsen mer användbar än variansen som ett mått på spridning. Det beror på att variationen mäts i kvadrerade enheter, medan standardavvikelsen mäts i samma enheter som data. Till exempel skulle variansen av en dataset som består av priser mäts i dollar kvadratisk och standardavvikelsen skulle mätas i dollar. Standardavvikelse är den mest använda mätningen av spridningen i en dataset.

Quartiles delar en dataset i fyra lika delar. Den första kvartilen (Q 1 ) delar upp data i den lägsta 25 procent av observationerna och den högsta 75 procenten (25 procent av observationerna är mindre än Q 1 < och 75 procent är större än Q 1 ). Den andra kvartilen (Q 2 ) delar upp data till den lägsta 50 procent av observationerna och högst 50 procent. Den tredje kvartilen (Q 3 ) delar upp data till den lägsta 75 procent av observationerna och högst 25 procent. Interkvartilintervallet (IQR) är lika med skillnaden mellan den tredje och den första kvartilen:

IQR representerar mitten av 50 procent av data.

Kvartilerna i en dataset illustreras bäst med en

ruttsplot. Följande bild visar en ruttsplot av de dagliga avkastningarna till ExxonMobil 2013. Boxdiagram över dagliga avkastningar till ExxonMobil-aktien 2013.

I rutan visar flera nyckelstatistik för ExxonMobil-avkastningen: > Minsta avkastning visas på ett diagram som en enda punkt längst ner i diagrammet (en ruta visar

utestängningar

som enskilda poäng). Q 1 visas som botten av lådan, Q 2 är den solida svarta linjen i mitten av lådan och Q 3 är toppen av lådan. Den maximala avkastningen visas som en enda punkt högst upp i diagrammet.

Hur mycket sprids finns i data? - dummies

Redaktörens val

Förstå alternativen för Drive Mode på din Canon EOS Rebel T6 / 1300D - dummies

Förstå alternativen för Drive Mode på din Canon EOS Rebel T6 / 1300D - dummies

Totalt erbjuder T6 fem Drive-inställningar. Men du kan bara komma åt alla fem om du ställer in lägesomkopplaren till ett av de avancerade exponeringslägena (P, Tv, Av eller M). I de andra lägena är dina val mer begränsade. Informationen beskriver här varje körläge och detalj som du ...

Genius of Digital Photography - dummies

Genius of Digital Photography - dummies

Genialet av digital fotografi är det faktum att du kan ta en bild med din digitalkamera och se den nästan omedelbart på kamerans LCD-skärm. Detta är helt uppriktigt också förbannelsen för digital fotografering. Det faktum att fotografer kan få omedelbar tillfredsställelse och fånga hundratals bilder på ett återanvändbart minne ...

På Dupies

På Dupies

När du använder scenlägen På din Canon EOS Rebel T3 eller T3i väljer kameran inställningar som gör ditt motiv med den traditionella "look" för scenen. Creative Auto-läget gör att du kan ta lite mer kontroll. Som namnet antyder är detta läge fortfarande mestadels automatiskt, men om du kontrollerar ...

Redaktörens val

Synkronisera Offline Spotify-spellistor direkt från din mobila enhet - dummies

Synkronisera Offline Spotify-spellistor direkt från din mobila enhet - dummies

Du kan snabbt markera några Spotify spellistor och göra dem tillgängliga offline direkt från din telefon - din dator behöver inte vara på eftersom du hämtar spår direkt från Spotifys egen server. Anslut till ett Wi-Fi-nätverk för att göra denna procedur när det är möjligt, i stället för 3G, eftersom Wi-Fi är sannolikt mycket snabbare ...

De många versionerna av Spotify - dummies

De många versionerna av Spotify - dummies

Spotify erbjuder en rad olika registreringsmetoder och abonnemangsnivåer. Spotify erbjuder en gratis version som låter dig spela med Spotify och använda den för att upptäcka ny musik - med några gränser. Efter att ha byggt några spellistor, delat spår och engagerar med vänner uppmuntras du att uppgradera för att bli av med annonserna, ...

Trådlös strömning utan Spotify Premium-dummies

Trådlös strömning utan Spotify Premium-dummies

Spotify-communityen upphör aldrig att förvåna - kommer alltid fram med innovativa sätt att Trådlöst strömma Spotify-musik genom högtalare. Vissa metoder kräver geekiga lösningar, och andra kräver att du köper en extra mjukvara som kommer att gå extra mil och leverera innehåll via fjärrhögtalare. Men vad sägs om att använda en trådlös installation ...

Redaktörens val

Tips för att börja Java-programmerare: När man inte använder en variabel dummies

Tips för att börja Java-programmerare: När man inte använder en variabel dummies

Ibland i Java, återanvändning av variabler gör ett program smidigt och lätt att läsa. Men som med de flesta saker finns det flip sida. Problemet vid handen tvingar dig att skapa nya variabler. Antag att du skriver kod för att vända bokstäverna i ett ord med fyra bokstäver. Du lagrar varje bokstav i sin egen separata del.

Några saker om Java GUIs - dummies

Några saker om Java GUIs - dummies

Innan du hoppar in i Java GUI, det finns några saker du borde känna till. Java levereras med tre uppsättningar klasser för att skapa GUI-applikationer: The Abstract Window Toolkit (AWT): Den ursprungliga uppsättningen klasser, som går tillbaka till JDK 1. 0. Klasser i denna uppsättning hör till paket vars namn börjar med java. AWT. Komponenter i detta ...

Tips för att välja rätt datum och tid för din Java-applikation - dummies

Tips för att välja rätt datum och tid för din Java-applikation - dummies

Den första ordern när du utvecklar en Java-applikation som måste fungera med datum eller tider (eller båda) plockar klassen Date-Time för att representera datum- och tidsvärden. Java tidspaket definierar tio olika klasser som används för att representera olika typer av tider och datum. Tio datum-tidsklasser i java. tidsklass vad det ...