Video: What's data aggregation? 2024
Sammanfattande data, hitta totals och beräkna medelvärden och andra beskrivande åtgärder är förmodligen inte nya för dig. När du behöver dina sammanfattningar i form av nya data, snarare än rapporter, kallas processen aggregering. Sammanlagda data kan utgöra grunden för ytterligare beräkningar, sammanfogade med andra dataset, som används på något sätt som andra data används.
Här är ett exempel på en dataaggregeringsprocess. En dataset innehåller allmän information om över 160 000 fastighetspaket. Dessa uppgifter innehåller en mängd olika markanvändningar. Vad händer om du vill se det genomsnittliga värderingsvärdet för marken i varje markanvändningskategori? Så här gör du det.
Du skulle hitta dataaggregationsverktyget i din data mining ansökan. Du kan använda sökningen för att hitta den.
Du skulle lägga till verktyget i en process och ansluta den till en källa dataset.
I dataaggregationsverktyget väljer du en gruppvariabel. I det här fallet är det markanvändningsvariabeln, C_A_CLASS.
Då skulle du definiera de sammanfattningar du vill ha. För att få det genomsnittliga värdet av marken väljer du variabeln med bedömningarna som sammanfattar och väljer den genomsnittliga funktionen.
När aggregeringen exekveras är resultatet ett nytt dataset, med en rad för varje typ av markanvändning och en ny variabel för de beräknade medelvärdena.
Förr eller senare måste du sammanställa en hel dataset. Men när du vill summera eller genomsnitta alla data i en dataset kan du komma in i ett problem: Vad är din gruppvariabler? Tricket är att använda en variabel med ett konstant värde för hela datasetet. Så, skapa en variabel där varje värde är detsamma, och använd det som din gruppvariabel.