Video: Sammanfoga tabeller i Excel med LETARAD och hantera dubbletter med ANTAL.OM och "Ta bort dubbletter" 2024
Data lagras på olika sätt i olika system. Så det är ingen överraskning att när du samlar och konsoliderar data från olika källor är det möjligt att dubbletter dyker upp. I synnerhet vad som gör en individuell rekord unik är olika för olika system.
Sammanfattning av investeringskonto är kopplad till ett kontonummer. En portföljöversikt kan lagras på enskild eller hushållsnivå. Och handelshistoriken för alla dessa konton lagras på den enskilda transaktionsnivån.
Det är viktigt att vara tydlig om vad som ska skilja på unika poster i din datafil. Om det till exempel är en transaktionsnivåfil, kopieras kontonummer och hushålls-ID. Så länge du förstår detta och gör en transaktionsnivåanalys kommer du att bli bra.
Men om du är intresserad av att använda denna data för att analysera antalet konton som innehas av varje hushåll, kommer du att stöta på problem. Hushållen som handlar oftare kommer att ha fler poster än de som inte handlar mycket. Du måste ha en fil på kontonivå.
Det är inte särskilt svårt att ta bort dubbla poster. De flesta statistiska paket och databas system har inbyggda kommandon som grupp poster tillsammans. (I själva verket är det i SQL-databasens språk, det här kommandot heter Group By.)