Video: Databaser och databashanterare, del 1 (av 2) 2024
Data som samlas in av stora organisationer inom daglig verksamhet lagras vanligtvis i databaser. Men databasadministratörer kan inte vara villiga att tillåta datavinnare direkt tillgång till dessa datakällor och direktåtkomst kan inte vara det bästa alternativet ur din synvinkel. Direkt åtkomst till operativa databaser (används för rutinmässiga affärer) kan vara en dålig idé eftersom
-
Data miners använder mycket data. Du kan oavsiktligt knyta samman resurser och störa vanliga affärsverksamheter.
-
Du kan oavsiktligt bryta mot en datasäkerhetslagstiftning eller annan datahantering krav om din dataåtkomst inte kontrolleras korrekt. Operationsdatabaser är inte organiserade för datautvinning.
-
Du kan ägna mycket tid på att kämpa för att få de data du behöver och är fortfarande inte säker på att du får det rätt. När du behöver data från en operativ databas (och du har lämpligt godkännande för att använda data), bör du diskutera dina behov med administratören som ansvarar för den data. Du måste förklara exakt vilka data du behöver, det format du behöver för datautvinning, och om du behöver data bara en gång eller löpande.
Pending data access är en annan sak. Administratören kanske inte vill ge data extraheringar om och om igen, och ger dig direkt tillgång till affärssystem är riskabelt. En gemensam lösning är att skapa en
analytisk databas. Detta är en vanlig relationell databas som är skild från konventionella affärssystem. Data överförs rutinmässigt (och automatiskt) från affärssystem till den analytiska databasen, och data minare kan komma åt det när som helst.
Om databasadministratören insisterar på att data inte kan lagras på det här sättet, fråga om det är möjligt att skapa en
vy (en lagrad fråga som kan ifrågasättas som om det var en vanlig datatabell) med den organisation som du behöver. Många data-miningprodukter kan läsa data från databaser. De steg som krävs varierar beroende på
Utformning av data-mining-programmet
-
Strukturen i källdatabasen
-
Middleware, vanligtvis kallad en
-
drivrutin ( ODBC-drivrutin, JDBC-drivrutin <), specialprogramvara som förmedlar databas- och applikationsprogramvaran Dokumentation för din data-mining-applikation ska berätta om det kan läsa data från en databas, och i så fall vilket verktyg eller funktion som ska användas och hur.Administratören som skapar analysdatabasen kan ge information om åtkomst till databasen. Om du redan är bekväm med att arbeta med databaser och andra applikationer, hittar du inget överraskande om att göra samma sak med en data mining applikation. Om databaser är nya för dig, få en kunnig person från din organisation för att gå igenom processen med din egen databas och data-mining ansökan.