Innehållsförteckning:
- Kalkylarkrapporter ger ineffektiva datamodeller
- Flatdatafiler låter sig snygga till datamodeller
- Tabelldataset är perfekt för pivottabellade datamodeller
Video: Är detta lämpligt? 2024
Som byggstenar för dina Excel-rapporter måste data i dina datamodeller struktureras på lämpligt sätt. Inte alla dataset skapas lika. Även om vissa dataset fungerar i en standard Excel-miljö, kanske de inte fungerar för datamodelleringsändamål. Innan du bygger din datamodell, se till att din källdata är lämpligt strukturerad för instrumentbrädans ändamål.
Risken för överförenkling innehåller dataset som vanligtvis används i Excel i tre grundläggande former:
-
Kalkylarkrapporten
-
Den platta datafilen
-
Tabelldatasetet
Punchlinjen är att endast platta datafiler och tabulära dataset ger effektiva datamodeller.
Kalkylarkrapporter ger ineffektiva datamodeller
Kalkylarkrapporter visar högformaterad, sammanfattad data och är ofta utformade som presentationsverktyg för hantering eller verkställande användare. En vanlig kalkylarkrapport gör en god användning av tomt utrymme för formatering, upprepar data för estetiska ändamål och presenterar endast högnivåanalys. Följande bild illustrerar en kalkylarkrapport.
Även om en kalkylarkrapport kan se bra ut, är det inte en effektiv datamodell. Varför? Den främsta orsaken är att dessa rapporter inte ger dig åtskillnad mellan data, analys och presentation. Du är väsentligen låst i en analys.
Även om du kunde göra diagram från den visade rapporten, skulle det vara opraktiskt att tillämpa någon analys utanför det som redan finns där. Till exempel, hur skulle du beräkna och presentera genomsnittet av all cykelförsäljning med den här rapporten? Hur skulle du beräkna en lista över de tio bästa marknaderna?
Med denna inställning tvingas du till mycket manuella processer som är svåra att behålla månad efter månad. Alla analyser utanför de höga nivåer som redan finns i rapporten är grundläggande i bästa fall - även med fina formler. Dessutom, vad händer när du måste visa cykelförsäljning per månad? När din datamodell kräver analys med data som inte finns i kalkylarkrapporten, är du tvungen att söka efter ett annat dataset.
Flatdatafiler låter sig snygga till datamodeller
En annan typ av filformat är en platt fil. Flatfiler är datalager som är organiserade av rad och kolumn. Varje rad motsvarar en uppsättning dataelement, eller en -post. Varje kolumn är ett fält. Ett fält motsvarar ett unikt dataelement i en post. Följande bild innehåller samma data som föregående rapport men uttryckt i ett plattdatafilformat.
En platt datafil.Observera att varje datafält har en kolumn och varje kolumn motsvarar ett dataelement. Dessutom finns det ingen extra avstånd, och varje rad (eller rekord) motsvarar en unik uppsättning information. Men nyckelfärdigheten som gör det till en platt fil är att inget enskilt fält identifierar en rekord. Faktum är att du måste ange fyra separata fält (region, marknad, företagsegment och månads försäljningsbelopp) innan du kan identifiera posten unikt.
Flatfiler låter sig snygga för datormodellering i Excel, eftersom de kan vara tillräckligt detaljerade för att hålla de data du behöver och fortfarande främjar ett brett spektrum av analyser med enkla formler - SUM, AVERAGE, VLOOKUP och SUMIF, bara för att nämna några.
Tabelldataset är perfekt för pivottabellade datamodeller
Många effektiva datamodeller drivs huvudsakligen av pivottabeller. Pivottabeller är Excels främsta analysverktyg. För dig som har använt pivottabeller vet du att de erbjuder ett utmärkt sätt att sammanfatta och forma data för användning genom att rapportera komponenter, till exempel diagram och tabeller.
Tabelldataset är idealiska för pivottabellade datamodeller. Följande figur illustrerar en tabellformat. Observera att den primära skillnaden mellan en tabelldataset och en platt datafil är att i kolumndataset inte dubbelsidiga etiketter dubbleras som faktiska data. Till exempel innehåller kolumnen Försäljningsperiod månadsidentifieraren. Denna subtila skillnad i struktur är vad som gör dataset för tabeller optimala datakällor för pivottabeller. Denna struktur säkerställer att nyckel-pivottabellfunktioner, som sortering och gruppering, fungerar som de ska.
En tabellformat.Attributen till en tabelldataset är följande:
-
Den första raden i datasetet innehåller fältetiketter som beskriver informationen i varje kolumn.
-
Kolonnetiketterna dras inte dubbelt som dataobjekt som kan användas som filter eller sökfrågor (till exempel månader, datum, år, regioner eller marknader).
-
Det finns inga tomma rader eller kolumner - varje kolumn har en rubrik och ett värde finns i varje rad.
-
Varje kolumn representerar en unik kategori av data.
-
Varje rad representerar enskilda objekt i varje kolumn.