Innehållsförteckning:
- Uppgift: Identifiera dina affärsmål
- Uppgift: Bedömning av din situation
- Uppgift: Definiera dina data-mining mål
- Uppgift: Att producera din projektplan
Video: Data Science Methodology 101 - Business Understanding Concepts and Case Study 2024
Cross Industry Industry Process för Data Mining ( CRISP-DM ) är den dominerande processramen för datautvinning. I den första fasen av ett data miningprojekt, innan du närmar dig data eller verktyg, definierar du vad du ska utföra och definierar orsakerna till att du vill uppnå detta mål.
Affärsidéfasen inkluderar fyra uppgifter (primära aktiviteter, som var och en kan innebära flera mindre delar).
Uppgift: Identifiera dina affärsmål
Det första du måste gör i något projekt att ta reda på exakt vad du försöker åstadkomma! Det är mindre uppenbart än det låter. Många datavinnare har investerat tid på dataanalys, för att bara se att deras förvaltning inte var särskilt intresserad av det problem de var Du måste börja med en klar förståelse av
-
Ett problem som din ledning vill ta itu med.
-
The affärsmål
-
Begränsningar (begränsningar av vad du kan göra, vilka lösningar som kan användas, när arbetet måste slutföras osv.)
-
Påverkan (hur problemet och möjliga lösningar passar in i verksamheten)
Leveranserna för den här uppgiften omfattar tre saker (vanligtvis korta rapporter som fokuserar på bara huvudpunkterna):
-
Bakgrund: Förklara affärssituationen som driver projektet. Denna artikel, som många som följer, uppgår endast till några stycken.
-
Affärsmål: Definiera vad din organisation avser att genomföra med projektet. Detta är vanligtvis ett bredare mål än att du som data miniräknare kan åstadkomma självständigt. Affärsmålet kan till exempel vara att öka försäljningen från en semesterannons kampanj med 10 procent år över år.
-
Affärs succékriterier: Definiera hur resultaten ska mätas. Försök att få tydligt definierade kvantitativa succeskriterier. Om du måste använda subjektiva kriterier (hint: termer som få inblick eller få ett handtag på ), får i det minste en överenskommelse om exakt vem som ska bedöma om dessa kriterier har eller inte har uppfyllts.
Uppgift: Bedömning av din situation
Här får du mer information om de problem som är kopplade till dina affärsmål. Nu kommer du att gå djupare in i fakta och bygga upp en mycket flaskigare förklaring av de frågor som beskrivs i affärsmålen uppgiften.
Leveranser för denna uppgift inkluderar fem djupgående rapporter:
-
Resursförteckning: En lista över alla resurser som finns tillgängliga för projektet.Dessa kan innefatta människor (inte bara datavinnare, utan även de med expertkunskap om affärsproblemet, datahanterare, teknisk support och andra), data, hårdvara och programvara.
-
Krav, antaganden och begränsningar: Krav kommer att innehålla ett schema för slutförande, lagar och säkerhetsförpliktelser och krav på godtagbart avslutat arbete. Det här är meningen att du ska ha tillgång till lämpliga data!
-
Risker och händelser: Identifiera orsaker som kan fördröja genomförandet av projektet och utarbeta en beredskapsplan för var och en av dem. Till exempel, om ett Internetavbrott på ditt kontor skulle kunna utgöra ett problem, kanske din beredskap kan vara att jobba på ett annat kontor tills avbrottet har upphört.
-
Terminologi: Skapa en lista över affärsvillkor och data-mining termer som är relevanta för ditt projekt och skriv ner dem i en ordlista med definitioner (och kanske exempel) så att alla som är inblandade i projektet kan ha en gemensam förståelse av dessa villkor.
-
Kostnader och fördelar: Förbered en kostnads-nyttoanalys för projektet. Försök att ange alla kostnader och fördelar i dollar (euro, pund, yen och så vidare). Om fördelarna inte överstiger kostnaderna väsentligt, stoppa och ompröva denna analys och ditt projekt.
Beslutsfattare känner ofta mer bekvämt med att tilldela resurser till projekt som sänker kostnaderna än de som syftar till att öka intäkterna. Var därför alltid ute efter kostnadsbesparingspotential och förstå möjligheterna att spara pengar först i din kostnads- och förmånsrapport.
Uppgift: Definiera dina data-mining mål
Att nå affärsmålen kräver ofta åtgärder från många människor, inte bara datagruvarna. Så nu måste du definiera din lilla del inom den större bilden. Om affärsmålen är att minska kundernas avgång, kan dina data-miningmål vara att identifiera avgångshastigheter för flera kundsegment och utveckla modeller för att förutsäga vilka kunder som har störst risk.
Leveranser för denna uppgift innehåller två rapporter:
-
Data mining mål: Definiera data-mining leveranser, som modeller, rapporter, presentationer och bearbetade dataset.
-
Succeskrav för datautvinning: Definiera de tekniska minimikraven för data mining som är nödvändiga för att stödja företagens framgångskriterier. Försök definiera dessa i kvantitativa termer (t.ex. modellnoggrannhet eller prediktiv förbättring jämfört med en befintlig metod). Om kriterierna måste vara kvalitativa, identifiera den person som gör bedömningen.
Uppgift: Att producera din projektplan
Nu anger du varje steg som du, dataväxlaren, avser att ta tills projektet är klart och resultaten presenteras och granskas.
Leveranserna för denna uppgift innehåller två rapporter:
-
Projektplan: Beskriv din stegvisa handlingsplan för projektet. Expandera konturen med ett schema för att slutföra varje steg, nödvändiga resurser, ingångar (till exempel data eller ett möte med en ämnesexpert) och utdata (t.ex. renad data, en modell eller en rapport) för varje steg, och beroenden (steg som inte kan börja tills detta steg är klart).Ange uttryckligen att vissa steg måste upprepas (t.ex. modellering och utvärdering kräver vanligtvis flera fram och tillbaka repetitioner).
-
Initial bedömning av verktyg och tekniker: Identifiera nödvändiga möjligheter för att möta dina data-mining mål och utvärdera de verktyg och resurser du har. Om något saknas måste du ta itu med den här frågan mycket tidigt i processen.