En autokorrelationsplot visar egenskaperna hos en typ av data känd som en tidsserie. En tidsserie avser observationer av en enda variabel över en viss tidshorisont. Till exempel är det dagliga priset på Microsoft-lager under år 2013 en tidsserie.
Tvärsnittsdata avser observationer på många variabler vid en enda punkt i tiden. Till exempel skulle stängningspriserna för de 30 bestånd som ingår i Dow Jones Industrial Average den 31 januari 2014 betraktas som tvärsnittsdata.
En autokorrelationsplot är utformad för att visa huruvida elementen i en tidsserie är positivt korrelerade, negativt korrelerade eller oberoende av varandra. (Prefixet auto betyder "själv" - autokorrelation hänvisar specifikt till korrelation mellan elementen i en tidsserie.)
En autokorrelationsdiagram visar värdet av autokorrelationsfunktionen (acf) på den vertikala axeln. Det kan sträcka sig från -1 till 1.
Den horisontella axeln i en autokorrelationsplot visar storleken på lag mellan elementen i tidsserierna. Till exempel är autokorrelationen med lag 2 korrelationen mellan tidsserieelementen och motsvarande element som observerades två tidsperioder tidigare.
Denna figur visar en autokorrelationsplot för de dagliga priserna på Apple-lager från 1 januari 2013 till 31 december 2013.
På grafen finns en vertikal linje (en "spik") som motsvarar varje fördröjning. Höjden på varje spik visar värdet av autokorrelationsfunktionen för lagret.
Autokorrelationen med lag noll motsvarar alltid 1, eftersom detta representerar autokorrelationen mellan varje term och sig själv. Pris och pris med lag noll är samma variabel.
Varje spik som stiger över eller faller under de streckade linjerna anses vara statistiskt signifikant. (kapitel 16 talar om detta i detalj.) Detta betyder att spiken har ett värde som skiljer sig väsentligt från noll. Om en spik skiljer sig avsevärt från noll, är det bevis på autokorrelation. En spik som ligger nära noll är bevis mot autokorrelation.
I detta exempel är spikarna statistiskt signifikanta för lags upp till 24. Det innebär att Apple-aktiekurserna är högt korrelerade med varandra. Med andra ord, när priset på Apple-aktier stiger, tenderar det att fortsätta att stiga.När priset på Apple-lager faller tenderar det att fortsätta falla. Denna figur illustrerar detta.
Tidsserier av dagliga priser på Apple-aktien.Även om de dagliga priserna på Apple-aktier är mycket korrelerade, kan det dagliga avkastningen inte vara. Du beräknar dagliga avkastningar från de dagliga priserna enligt följande:
var
r t = Den kontinuerligt sammanslagna returen vid tiden t
P t = Priset vid tid t
Pt -1 = Priset vid tiden t - 1 (en period före t)
Ln = Den naturliga logaritmen
Den naturliga logaritmen är logaritmen med basen e, vilket är ungefär lika med 2. 71828 ….
Denna figur visar en autokorrelationsplot för den dagliga avkastningen till Apples lager från 1 januari 2013 till 31 december 2013.
Autokorrelationsdiagram över dagliga avkastningar till Apple-aktien.Autokorrelationsdiagrammet för dagliga avkastningar till Apple-lager visar att de flesta spikarna inte är statistiskt signifikanta. Detta indikerar att avkastningen inte är högt korrelerad, som visas här.
Diagrammet visar att förutom en stor nedgång återgår till Apple-lager mellan 1 januari, 2013 och 31 december 2013 visar inte något särskilt mönster - de tenderar att fluktuera slumpmässigt runt noll. Det innebär att avkastningen är i stort sett oberoende av varandra.
Du kan använda en autokorrelationsplot för att avgöra om elementen i en tidsserie är slumpmässig (det vill säga inte relaterade till varandra). Detta är viktigt, eftersom många statistiska tester som omfattar tidsserier är baserade på detta antagande.
Som du kan se finns det många olika sätt att visualisera dina data. En bild är värd tusen ord, som ordstaven säger. Och det gäller helt klart i dataanalys. Statistiska mjukvarupaket är vanligtvis utrustade med lättanvända grafiska verktyg. Genom att dra nytta av dem kan du snabbt få insikt i dina data så att ingen mängd krossning kan ge dig.