Video: Identifying individuals, variables and categorical variables in a data set | Khan Academy 2024
För en dataset som består av observationer som tagits vid olika tidpunkter (det vill säga, tidsseriedata ), är det viktigt att avgöra om observationerna är korrelerade med varandra. Detta beror på att många tekniker för modellering av tidsseriedata baseras på antagandet att uppgifterna är okorrelerade med varandra (oberoende).
En grafisk teknik som du kan använda för att se om data är okorrelerade med varandra är autokorrelationsfunktionen. Autokorrelationsfunktionen visar korrelationen mellan observationer i en tidsserie med olika lags. Till exempel hänvisar korrelationen mellan observationer med lag 1 till korrelationen mellan varje enskild observation och dess tidigare värde.
Denna figur visar autokorrelationsfunktionen för ExxonMobils dagliga avkastning 2013.
Autokorrelationsfunktion av dagliga avkastningar till ExxonMobil-lageret 2013.Varje "spik" i autokorrelationsfunktionen representerar korrelationen mellan observationer med en given lag.
Autokorrelationen med lag 0 är alltid lika med 1, eftersom detta representerar observationernas korrelation med sig själva.
I diagrammet representerar de streckade linjerna de lägre och övre gränserna för ett konfidensintervall. Om en spik stiger över den övre gränsen för konfidensintervallet eller faller under den nedre gränsen för konfidensintervallet, visar det att korrelationen för den här fördröjningen inte är 0. Detta är bevis mot elementens oberoende i en dataset.
I detta fall finns det endast en statistiskt signifikant spik (vid lag 8). Denna spets visar att ExxonMobil-avkastningen kan vara oberoende. Ett mer formellt statistiskt test skulle visa om det är sant eller inte.