Hem Personliga finanser Hur man katalogiserar befintliga extrahera filer - dummies

Hur man katalogiserar befintliga extrahera filer - dummies

Video: SCP-1461 House of the Worm | euclid | Church of the Broken God scp 2025

Video: SCP-1461 House of the Worm | euclid | Church of the Broken God scp 2025
Anonim

När du börjar överväga vad du ska göra om extraktionsfilerna och andra typer av slags datalagringsmiljöer som finns i din organisation, måste du hitta dem - som du kanske skulle ha svårt, med tanke på de omgivande naturen hos dessa miljöer.

Här är ett tips: Följ rapporterna. Genom grupparbeten och individuella möten bestämma och katalogisera de rapporter som anställda använder i hela organisationen som du arbetar med för att bygga ett datalager. Några av dessa rapporter kommer antagligen direkt från produktionsapplikationerna och deras respektive databaser och filer.

För tillfället oroa dig inte om dessa produktionsapplikationsrapporter. (Håll reda på dem, för du kan använda dem som en utmärkt utgångspunkt för analysen "Vilka data behöver vi?", Vilket avgör vad du vill lägga in datalageret.) Andra rapporter kommer från data som extraheras från en eller flera applikationer och lagras någonstans. Dessa rapporter är de som ska koncentreras om nu.

Använd uppsättningen rapporter som utgångspunkt, bestämma först vem som använder dem och vem ansvarar för att generera dem. Du behöver veta vem som använder de genererade rapporterna eftersom du kan upptäcka att ingen använder dem längre. Bara genom att utvärdera inventeringen av rapporter och deras nuvarande utnyttjande, är du halvvägs klar med att eliminera denna funktion som inte är riktigt användbar från din datalagringsmiljö (och hantera dess komplexitet).

När du förstår rapportens användningsmönster får du veta vilka personer som är ansvariga för att generera rapporterna. De är de som förmodligen kan berätta för var de får data, vilka processer de använder för att förbereda och ladda data innan de kör rapporterna och vilka problem och problem de har med tillgång till data och integritet.

Ibland känner ingen enskild person hela slutet-till-slutet-sekvensen av steg som används för att extrahera data, förbereda och organisera den data och köra rapporterna - speciellt när dessa processer passerar organisationsgränser. (IT-organisationen hanterar till exempel den första utvinningen av data och en viss rudimentär kvalitetssäkring, och affärsorganisationen hanterar sammanslagningsprocesserna och kör rapporterna.)

I dessa situationer får alla dessa människor i samma rum för att diskutera och komma överens om hur sakerna fungerar. Du kan undvika att spendera mycket tid på att spela "han sa", sa hon "med människor som uppriktigt sagt försvårar dig med dina ständiga frågor och förfrågningar om möten.

Så småningom får du en komplett bild av vem som använder vilken data, vem som är ansvarig för att göra data tillgängliga och vad som händer bakom kulisserna för att få allt att hända.

Glöm inte varför en del av bilden - för vilka affärsändamål extraheras filer används. Du måste ta reda på den här informationen ändå, som en del av din kravanalys. Medan du checkar ut vad som händer idag, ställ frågor när du har användarnas uppmärksamhet, till exempel:

  • Varför behöver du informationen i rapporten?

  • Vilka beslut hjälper den här rapporten till att göra?

  • När du analyserar data på rapporten, vem kommunicerar du med dina resultat?

Din frågeställning ska följa en traditionell förståelse av vad kraven på rapporten är. Att få en fast förståelse av dessa frågor vid denna analyspunkt kommer att spara tid på lång sikt.

Hur man katalogiserar befintliga extrahera filer - dummies

Redaktörens val

Butik Stora data med HBase-dummies

Butik Stora data med HBase-dummies

HBase är en distribuerad, icke-relativ (kolumnär) databas som använder HDFS som dess uthållighet butik för stora dataprojekt. Den modelleras efter Google BigTable och kan ta emot mycket stora tabeller (miljarder kolumner / rader) eftersom den är lagrad på Hadoop-kluster av råvara. HBase tillhandahåller slumpmässig, realtid läs / skrivåtkomst till stora data. HBase ...

Strömmande algoritmer och blomfilters - dummies

Strömmande algoritmer och blomfilters - dummies

I hjärtat av många strömmande algoritmer är Bloom-filter. Skapat för nästan 50 år sedan av Burton H. Bloom, i en tid då datavetenskapen fortfarande var ganska ung, var den ursprungliga avsikten för denna algoritms skapare att handla utrymme (minne) och / eller tid (komplexitet) mot vad han kallade tillåtna fel. Hans ursprungliga papper heter ...

Lagring av data i Bigtables - dummies

Lagring av data i Bigtables - dummies

En Bigtable har tabeller precis som en RDBMS gör, men i motsats till en RDBMS, en Bigtable tabeller har i allmänhet inga relationer med andra tabeller. Istället grupperas komplexa data i ett enda bord. En tabell i en Bigtable består av grupper av kolumner, kallade kolumnfamiljer och en radnyckel. Dessa tillsammans möjliggör snabb uppslagning av ...

Redaktörens val

Bestämmer publiken för din finansiella modell - dummies

Bestämmer publiken för din finansiella modell - dummies

Som kommer att se eller använda din ekonomiska modell i framtiden ? Om det bara är för egen användning, bör du fortfarande följa bra modelldesign men det är inte nödvändigt att spendera mycket tid på formateringen så att den ser cool ut. Du borde fortfarande lägga till antaganden och källdokumentation för din egen ...

Radera celler och data i Excel 2007 - dummies

Radera celler och data i Excel 2007 - dummies

I Microsoft Office Excel 2007 när du behöver radera data , ta bort formatering i ett cellval, eller ta bort hela celler, rader eller kolumner, du har många alternativ beroende på ditt mål. Excel kan utföra två typer av cellborttagningar i ett kalkylblad: rensa celldata och radera cellen. Rensa cellinnehållet Rensa bara ...

Redigera en diagrams datakälla i Excel 2007 - dummies

Redigera en diagrams datakälla i Excel 2007 - dummies

Efter att du skapat ett diagram i Excel 2007 kan behöva byta intervallet för källdata som ligger till grund för diagrammet. Dialogrutan Välj datakälla låter dig välja ett annat källområde för ett befintligt diagram. Du kan även använda den här dialogrutan för att byta rad och ...

Redaktörens val

Praktiska Excel PivotTable Tools - dummies

Praktiska Excel PivotTable Tools - dummies

Excel PivotTables ger dig ett extremt kraftfullt verktyg för cross-tabulering av arbetsbladdata. Och kanske är det bara vad du förväntar dig av Microsoft och Excel. Men vet du vad? Jag antar att du kan bli förvånad över hur många verktyg som är enkla att använda visas på fliken PivotTable Tools Analyze, som är tillgänglig när ett pivottabell ...

Hur man får tillgång till vanliga redigeringskommandon i Excel 2007 - dummies

Hur man får tillgång till vanliga redigeringskommandon i Excel 2007 - dummies

Ibland vill du göra ändringar i information som du lägger in i Excel 2007-arbetsblad och arbetsböcker (kallas kalkylblad i världen utanför Excel). När så är fallet kan du använda de snygga nycklarna som är inbyggda i Excel 2007 eller komma åt kommandot via fliken Excel Ribbon som är nya i Excel 2007. För att få ...

Hur man får tillgång till vanliga Excel 2007-filkommandon - dummies

Hur man får tillgång till vanliga Excel 2007-filkommandon - dummies

Du kan köra Excel 2007s grundläggande filkommandon i två olika sätt: genom att trycka på en kombination av genvägar eller genom att klicka i Excel-bandet. Följande diagram visar några av de vanligaste filkommandon i Excel 2007 och de två sätten du kan komma åt dem: Excel-kommandotillgänglighetstangenter Funktion Microsoft ...