Innehållsförteckning:
- Fokusera på datautvinningsverksamheten
- Förstå hur gruvbrytare spenderar sin tid
- Lär känna datautvinningsprocessen
- Att göra modeller
- Förstå matematiska modeller
- Införa information till handling
Video: What is Bitcoin Mining? 2024
Om du tänker på data som råmaterial och den information du kan få från data som något värdefull och relativt raffinerad, kan processen med att extrahera information vara jämfört med att extrahera metall från malm eller pärlor från smuts. Således kom termen data mining från.
Fokusera på datautvinningsverksamheten
Data minare diskuterar inte bara data utan att hoppas kunna hitta något intressant. Varje data-gruvprojekt börjar med ett specifikt affärsproblem och ett mål att matcha.
Som data miniräknare har du förmodligen inte befogenhet att fatta slutliga affärsbeslut, så det är viktigt att du anpassar ditt arbete med beslutsfattarnas behov. Du måste förstå sina problem, behov och preferenser och fokusera dina ansträngningar på att ge information som stöder bra affärsbeslut.
Din egen affärskunskap är mycket viktig. Exekutörer kommer inte att sitta bredvid dig medan du jobbar, och ger feedback om relevansen av dina upptäckter till deras oro. Du måste använda din egen erfarenhet och ansträngning för att döma det själv när du jobbar.
Förstå hur gruvbrytare spenderar sin tid
Det skulle vara bra om datavinnare kunde spendera hela dagen med förändringar i livet, bygga värdefulla modeller och integrera dem i vardagliga affärer. Men det är som att säga att det skulle vara bra om idrottare kunde spendera alla dagars vinnande turneringar. Det krävs mycket förberedelse för att bygga upp till de triumfens ögonblick. Så, som idrottare, spenderar datavinnare mycket tid på förberedelser.
Lär känna datautvinningsprocessen
En bra arbetsprocess hjälper dig att få ut mesta möjliga av din tid, dina data och alla dina andra resurser. I den här boken hittar du den mest populära data-miningprocessen, CRISP-DM. Det är en sexfasig cykel av upptäckt och åtgärd som skapats av ett konsortium av data minare från många branscher, och en öppen standard som alla kan använda.
Faserna i CRISP-DM-processen är
-
Företagsförståelse
-
Dataförståelse
-
Dataförberedelse
-
Modellering
-
Utvärdering
-
Distribution (med modeller i daglig verksamhet)
Varje fas har lika stor vikt för kvaliteten på resultaten och värdet för verksamheten. Men vad gäller den tid som krävs, dominerar datapreparationen. Databehandling tar rutinmässigt mer tid än alla andra faser av datautvinningsprocessen i kombination.
Att göra modeller
När målen förstås, och uppgifterna städas och redo att användas, kan du uppmärksamma att bygga prediktiva modeller.Modeller gör vilka rapporter som inte kan De ger dig information som stöder åtgärd.
En rapport kan berätta att försäljningen är nere. Det kan sätta ner försäljningen efter region, produkt och kanal så att du vet var försäljningen avvisades och om dessa minskningar var utbrett eller endast på vissa områden påverkades. Men de ger dig inga ledtrådar om varför försäljning minskade eller vilka åtgärder som kan hjälpa till att återuppliva verksamheten.
Modeller hjälper dig att förstå de faktorer som påverkar försäljningen, de åtgärder som tenderar att öka eller sänka försäljningen och de strategier och taktik som gör att ditt företag kan fungera smidigt. Det är spännande, eller hur? Kanske är det därför som de flesta data minare anser att modellering är den roliga delen av jobbet.
Förstå matematiska modeller
Matematiska modeller är centrala för data mining, men vad är de? Vad gör de, hur fungerar de och hur skapas de?
En matematisk modell är ren och enkel, en ekvation eller en uppsättning ekvationer som beskriver förhållandet mellan två eller flera saker. Sådana ekvationer är stenografi för teorier om naturens och samhällets arbete. Teorin kan stödjas av en väsentlig bevisning eller det kan bara vara en vild gissning. Matematikens språk är detsamma i båda fallen.
Villkor som prediktiv modell, statistisk modell, eller linjär modell hänvisar till specifika typer av matematiska modeller, namnen som speglar den avsedda användningen, formuläret eller metoden för härledning en viss modell. Dessa tre exempel är bara några av många sådana termer.
När en modell nämns i en företagsinställning är det troligtvis en modell som används för att göra förutsägelser. Modeller används för att förutsäga aktiekurser, produktförsäljning och arbetslöshet bland många andra saker.
Dessa förutsägelser kan eller inte vara korrekta, men för en given uppsättning värden (kända faktorer som dessa kallas oberoende variabler eller ingångar ) som ingår i modellen, kommer du att hitta en väldefinierad förutsägelse (även kallad beroende variabel, utgång, eller resultat ). Matematiska modeller används också för andra ändamål i affärer, till exempel för att beskriva de arbetsmekanismer som driver en viss process.
I datautvinning skapar du modeller genom att hitta mönster i data med maskininlärning eller statistiska metoder. Data miners följer inte samma noggranna inställning som klassiska statistiker gör, men alla modeller är härledda från faktiska data och konsekvent matematisk modelleringsteknik. Alla data-mining modeller stöds av en mängd bevis.
Varför använda matematiska modeller? Kunde inte samma förhållanden beskrivas med hjälp av ord? Det är möjligt, men du hittar vissa fördelar med användningen av ekvationer. Dessa inkluderar
-
Bekvämlighet: Jämfört med ekvivalenta beskrivningar utskrivna i meningar, ekvationer är korta. Matematisk symbolik har utvecklats speciellt för att representera matematiska relationer; språk som engelska har inte.
-
Klarhet: Ekvationer förmedlar idéer kortfattat och är entydiga.De är inte föremål för olika tolkningar baserade på kultur, och symboliken för matematik är ett slags gemensamt språk som används över hela världen.
-
Konsistens: Eftersom matematiska representationer är entydiga, definieras konsekvenserna av en viss situation tydligt av en matematisk modell.
Införa information till handling
Endast en modell ger värde när du använder den i verksamheten. En modells förutsägelser kan stödja beslutsfattandet på olika sätt. Du kanske
-
införliva förutsägelser i en rapport eller presentation som ska användas för att fatta ett visst beslut.
-
Integrera modellen i ett operativsystem (t.ex. ett kundservicesystem) för att ge realtidsprognoser för daglig användning. (Till exempel kan du flagga försäkringsanspråk för omedelbar betalning, omedelbar avslag eller ytterligare undersökning.)
-
Använd modellen för satspredictions. (Du kan till exempel göra en lista över kundlistan för att bestämma vilka kunder som ska få ett visst erbjudande.)