Hem Personliga finanser Tekniska analysmetoder (EDA) - dummies

Tekniska analysmetoder (EDA) - dummies

Innehållsförteckning:

Video: Guide: Lär dig handla aktier med Teknisk Analys (TA) 2024

Video: Guide: Lär dig handla aktier med Teknisk Analys (TA) 2024
Anonim

EDA baseras kraftigt på grafiska tekniker. Du kan använda grafiska tekniker för att identifiera de viktigaste egenskaperna hos en dataset. Här är några av de mer använda grafiska teknikerna:

  • Boxplots

  • Histograms

  • Normala sannolikhetsgrader

  • Scatter plots

Box plots

Du använder rutor för att visa några av de viktigaste funktioner i en dataset, till exempel följande:

  • Minsta värde

  • Högsta värde

  • Quartiles

Quartiles separerar en dataset i fyra lika delar. Den första kvartilen (Q 1 ) är ett värde så att följande är sant:

25 procent av observationerna i en dataset är mindre än det första kvartilet.

75 procent av observationerna är större än den första kvartilen.

Den andra kvartilen (Q 2 ) är ett värde så att

50 procent av observationerna i en dataset är mindre än den andra kvartilen.

50 procent av observationerna är större än den andra kvartilen.

Den andra kvartilen är också känd som medianen.

Den tredje kvartilen (Q 3 ) är ett värde så att

75 procent av observationerna i en dataset är mindre än det tredje kvartilet.

25 procent av observationerna är större än det tredje kvartilet.

Du kan också använda rutrutor för att identifiera outliers. Dessa är värden som skiljer sig väsentligt från resten av datasetet. Outliers kan orsaka problem för traditionella statistiska test, så det är viktigt att identifiera dem innan någon typ av statistisk analys utförs.

Histogram

Du använder histogram för att få inblick i sannolikhetsfördelningen som en dataset följer. Med ett histogram är datasetet organiserat i en serie av individuella värden eller värden, varje representerad av en vertikal streck. Höjden på stapeln visar hur ofta ett värde eller värdeintervall inträffar. Med ett histogram är det enkelt att se hur data distribueras.

Scatter plots

En scatterplot är en serie punkter som visar hur två variabler är relaterade till varandra. En slumpmässig spridning av poäng indikerar att de två variablerna inte är relaterade eller att förhållandet mellan dem är mycket svagt. Om punkterna liknar en rak linje, indikerar detta att förhållandet mellan de två variablerna är approximativt linjärt.

Två variabler är linjärt relaterade om de kan beskrivas med ekvationen Y = mX + b .

X är den oberoende variabeln, och Y är den beroende variabeln. m är höjden , som representerar förändringen i Y på grund av en given ändring i X . b är avsnitten, som visar värdet på Y när X är lika med noll. Figuren visar ett spridningsdiagram mellan två variabler där förhållandet verkar vara linjärt.

Spridningsdiagram av ett linjärt förhållande.

Punkterna på scatterplotet bildar nästan en rak linje. Det böjer lite till vänster och böjer lite till höger, men det är ungefär rakt. Detta visar att förhållandet är linjärt, med en positiv lutning.

Följande bild visar ett scatterplot mellan två variabler där

Y verkar stiga snabbare än X. Scatterplot av ett olinjärt förhållande.

Se kurvan? Detta förhållande är helt klart inte linjärt. Det är faktiskt ett kvadratiskt förhållande. Ett kvadratiskt förhållande tar formen

Y = aX 2 + b X + c . Följande bild visar ett scatterplot där det inte förefaller vara något samband mellan

X och Y . X

och Y. "width =" 535 "> Scatterplot utan relation mellan variablerna

X och Y. De variabler som visas i

är inte relaterade < eller självständigt; du kan se detta genom att det inte finns något mönster i data. Förutom att visa förhållandet mellan två variabler kan en scatterplot också visa närvaron av avvikare. Följande bild visar en dataset med en observation som skiljer sig väsentligt från de andra observationerna. Scatterplot med en outlier.

Outlier-punkten måste undersökas ytterligare för att avgöra om det är resultatet av ett fel eller andra problem. Det är möjligt att outliern måste avlägsnas från data.

Normala sannolikhetsgrader

Normala sannolikhetsgrader

används för att se hur nära elementet i en dataset följer normalfördelningen. vanligt i många discipliner. Exempelvis antas det ofta i ekonomi och ekonomi att r eturns till aktier distribueras normalt. Normalt antagandet är mycket bekvämt och många statistiska tester bygger på detta antagande.

Användning av statistiska tester som antar normalitet till en icke-normal

dataset skulle ge extremt tveksamt resultat. Därför är det viktigt att avgöra huruvida data distribueras normalt innan de utför någon av dessa statistiska tester.

Tekniska analysmetoder (EDA) - dummies

Redaktörens val

Fastighetsprofessionens grunder för fastighetslicensexamen - dummies

Fastighetsprofessionens grunder för fastighetslicensexamen - dummies

Fastighetsexamen kommer att förvänta dig att du har ett grundläggande grepp på fastighetsbranschen. Du tror att det bara är uppenbart att veta vad de viktigaste spelarna gör i en fastighetsaffär, men på grund av den terminologi de delar, blir skillnaderna mellan spelarna lite muddlade. Här är snabba beskrivningar ...

Kostnadsmetoden för fastighetslicensexamen - dummies

Kostnadsmetoden för fastighetslicensexamen - dummies

En metod för att uppskatta Värdet på fastigheter kallas kostnaden. Du måste känna till formeln för fastighetslicensexamen. Kostnadsmetoden baseras på tanken att komponenterna i en fastighet eller marken och byggnaderna kan läggas till för att komma fram till ...

Studie för fastighetslicensexamen - dummies

Studie för fastighetslicensexamen - dummies

När var sista gången du tog en multipelvalsexamen ? Eller, för den delen, någon examen? Det är troligt att det var länge sedan. Kanske överväger du huruvida du ska bli en fastighetsmäklare, men du är lite avskräckt av tanken på att du måste göra ett test. Vad du kan ...

Redaktörens val

Följer ett basketspel på tv - dummies

Följer ett basketspel på tv - dummies

Du kommer bli mycket mer ute av att titta på ett basketspel på TV - eller till och med leva - om du gör mer än att se bollen gå in i rammen. Kolla in dessa insider tips för att fånga den verkliga åtgärden och öka din njutning av sporten. Förutse nästa pass Försök att tänka som ...

Top 5 Fantasy Basketball League Sites - Dummies

Top 5 Fantasy Basketball League Sites - Dummies

Att hitta och gå med på en fantasy basketplats kan ibland vara skrämmande uppgift eftersom så många alternativ är tillgängliga och de flesta webbplatser ser lika ut. Bara för att webbplatser ser ut som det betyder inte nödvändigtvis att de mäter i värde. Vissa webbplatser erbjuder gratis ligor, andra betalade - och vissa webbplatser tillhandahåller bara standard liga ...

Tryck på motståndarna i Basket - Dummies

Tryck på motståndarna i Basket - Dummies

Pressen är kort för tryck. Ofta kallad en fullrättspress, det här är ett anfallande försvar som används på backen, där målet är att tvinga en omsättning. Vanligtvis används efter en gjord korg, svänger pressgruppen över motståndarna i backcourt; Om motståndarna lyckas få bollen förbi halvvägs (kallad brytning ...

Redaktörens val

Hur R beräknar oändliga, odefinierade och saknade värden - dummies

Hur R beräknar oändliga, odefinierade och saknade värden - dummies

Lyckligtvis kan R hantera dataanomalier som förvirrar några andra statistiska plattformar. I vissa fall har du inte reella värden att beräkna med. I de flesta verkliga dataset saknas faktiskt åtminstone några värden. Dessutom har vissa beräkningar oändlighet som ett resultat (som att dividera med noll) eller kan inte ...

Hur man lägger till linjer i en plot i R-dummies

Hur man lägger till linjer i en plot i R-dummies

I R, lägger du till rader i en plott på ett mycket liknande sätt att lägga till poäng, förutom att du använder funktionen linjer () för att uppnå detta. Men använd först lite R magi för att skapa en trendlinje genom data, kallad en regressionsmodell. Du använder lm () -funktionen för att uppskatta en linjär ...

Hur man lägger till en andra dimension i R-dummies

Hur man lägger till en andra dimension i R-dummies

Förutom vektorer kan R representera matriser som ett objekt du arbetar och beräknar med. Faktum är att R verkligen lyser när det gäller matrisberäkningar och -operationer. Vektorer är nära relaterade till en större klass av objekt, arrays. Arrayer har två mycket viktiga egenskaper: De innehåller bara en enda typ av värde. De har ...