Hem Personliga finanser Vad Data Miners Do-dummies

Vad Data Miners Do-dummies

Innehållsförteckning:

Video: What is Bitcoin Mining? 2024

Video: What is Bitcoin Mining? 2024
Anonim

Om du tänker på data som råmaterial och den information du kan få från data som något värdefull och relativt raffinerad, kan processen med att extrahera information vara jämfört med att extrahera metall från malm eller pärlor från smuts. Således kom termen data mining från.

Fokusera på datautvinningsverksamheten

Data minare diskuterar inte bara data utan att hoppas kunna hitta något intressant. Varje data-gruvprojekt börjar med ett specifikt affärsproblem och ett mål att matcha.

Som data miniräknare har du förmodligen inte befogenhet att fatta slutliga affärsbeslut, så det är viktigt att du anpassar ditt arbete med beslutsfattarnas behov. Du måste förstå sina problem, behov och preferenser och fokusera dina ansträngningar på att ge information som stöder bra affärsbeslut.

Din egen affärskunskap är mycket viktig. Exekutörer kommer inte att sitta bredvid dig medan du jobbar, och ger feedback om relevansen av dina upptäckter till deras oro. Du måste använda din egen erfarenhet och ansträngning för att döma det själv när du jobbar.

Förstå hur gruvbrytare spenderar sin tid

Det skulle vara bra om datavinnare kunde spendera hela dagen med förändringar i livet, bygga värdefulla modeller och integrera dem i vardagliga affärer. Men det är som att säga att det skulle vara bra om idrottare kunde spendera alla dagars vinnande turneringar. Det krävs mycket förberedelse för att bygga upp till de triumfens ögonblick. Så, som idrottare, spenderar datavinnare mycket tid på förberedelser.

Lär känna datautvinningsprocessen

En bra arbetsprocess hjälper dig att få ut mesta möjliga av din tid, dina data och alla dina andra resurser. I den här boken hittar du den mest populära data-miningprocessen, CRISP-DM. Det är en sexfasig cykel av upptäckt och åtgärd som skapats av ett konsortium av data minare från många branscher, och en öppen standard som alla kan använda.

Faserna i CRISP-DM-processen är

  1. Företagsförståelse

  2. Dataförståelse

  3. Dataförberedelse

  4. Modellering

  5. Utvärdering

  6. Distribution (med modeller i daglig verksamhet)

Varje fas har lika stor vikt för kvaliteten på resultaten och värdet för verksamheten. Men vad gäller den tid som krävs, dominerar datapreparationen. Databehandling tar rutinmässigt mer tid än alla andra faser av datautvinningsprocessen i kombination.

Att göra modeller

När målen förstås, och uppgifterna städas och redo att användas, kan du uppmärksamma att bygga prediktiva modeller.Modeller gör vilka rapporter som inte kan De ger dig information som stöder åtgärd.

En rapport kan berätta att försäljningen är nere. Det kan sätta ner försäljningen efter region, produkt och kanal så att du vet var försäljningen avvisades och om dessa minskningar var utbrett eller endast på vissa områden påverkades. Men de ger dig inga ledtrådar om varför försäljning minskade eller vilka åtgärder som kan hjälpa till att återuppliva verksamheten.

Modeller hjälper dig att förstå de faktorer som påverkar försäljningen, de åtgärder som tenderar att öka eller sänka försäljningen och de strategier och taktik som gör att ditt företag kan fungera smidigt. Det är spännande, eller hur? Kanske är det därför som de flesta data minare anser att modellering är den roliga delen av jobbet.

Förstå matematiska modeller

Matematiska modeller är centrala för data mining, men vad är de? Vad gör de, hur fungerar de och hur skapas de?

En matematisk modell är ren och enkel, en ekvation eller en uppsättning ekvationer som beskriver förhållandet mellan två eller flera saker. Sådana ekvationer är stenografi för teorier om naturens och samhällets arbete. Teorin kan stödjas av en väsentlig bevisning eller det kan bara vara en vild gissning. Matematikens språk är detsamma i båda fallen.

Villkor som prediktiv modell, statistisk modell, eller linjär modell hänvisar till specifika typer av matematiska modeller, namnen som speglar den avsedda användningen, formuläret eller metoden för härledning en viss modell. Dessa tre exempel är bara några av många sådana termer.

När en modell nämns i en företagsinställning är det troligtvis en modell som används för att göra förutsägelser. Modeller används för att förutsäga aktiekurser, produktförsäljning och arbetslöshet bland många andra saker.

Dessa förutsägelser kan eller inte vara korrekta, men för en given uppsättning värden (kända faktorer som dessa kallas oberoende variabler eller ingångar ) som ingår i modellen, kommer du att hitta en väldefinierad förutsägelse (även kallad beroende variabel, utgång, eller resultat ). Matematiska modeller används också för andra ändamål i affärer, till exempel för att beskriva de arbetsmekanismer som driver en viss process.

I datautvinning skapar du modeller genom att hitta mönster i data med maskininlärning eller statistiska metoder. Data miners följer inte samma noggranna inställning som klassiska statistiker gör, men alla modeller är härledda från faktiska data och konsekvent matematisk modelleringsteknik. Alla data-mining modeller stöds av en mängd bevis.

Varför använda matematiska modeller? Kunde inte samma förhållanden beskrivas med hjälp av ord? Det är möjligt, men du hittar vissa fördelar med användningen av ekvationer. Dessa inkluderar

  • Bekvämlighet: Jämfört med ekvivalenta beskrivningar utskrivna i meningar, ekvationer är korta. Matematisk symbolik har utvecklats speciellt för att representera matematiska relationer; språk som engelska har inte.

  • Klarhet: Ekvationer förmedlar idéer kortfattat och är entydiga.De är inte föremål för olika tolkningar baserade på kultur, och symboliken för matematik är ett slags gemensamt språk som används över hela världen.

  • Konsistens: Eftersom matematiska representationer är entydiga, definieras konsekvenserna av en viss situation tydligt av en matematisk modell.

Införa information till handling

Endast en modell ger värde när du använder den i verksamheten. En modells förutsägelser kan stödja beslutsfattandet på olika sätt. Du kanske

  • införliva förutsägelser i en rapport eller presentation som ska användas för att fatta ett visst beslut.

  • Integrera modellen i ett operativsystem (t.ex. ett kundservicesystem) för att ge realtidsprognoser för daglig användning. (Till exempel kan du flagga försäkringsanspråk för omedelbar betalning, omedelbar avslag eller ytterligare undersökning.)

  • Använd modellen för satspredictions. (Du kan till exempel göra en lista över kundlistan för att bestämma vilka kunder som ska få ett visst erbjudande.)

Vad Data Miners Do-dummies

Redaktörens val

Nätverksenheter och tjänster Översikt för certifikatprov på CCENT-dummies

Nätverksenheter och tjänster Översikt för certifikatprov på CCENT-dummies

Du kan vara säker på att få några frågor om certifieringsexamen som testar din kunskap om typer av enheter och olika nätverkstjänster. Nedan följer några viktiga punkter att komma ihåg om enheter och tjänster: Nätverksenheter Hubb: Ett nav är en lag 1-enhet som används för att ansluta system tillsammans. När ...

OSI-modell för CCENT-certifieringsexamen - dummies

OSI-modell för CCENT-certifieringsexamen - dummies

Certifieringen certifierar dig kraftigt på OSI-modellen och olika protokoll och enheter som körs på varje lager av OSI-modellen. I följande tabell granskas OSI-modellen genom att ge dig en beskrivning av varje lager och exempel på protokoll och enheter som körs i varje lager. Layer Beskrivning Exempel 7. Applikation ...

OSI-modell för Cisco ICND1-certifieringsexamen - dummies

OSI-modell för Cisco ICND1-certifieringsexamen - dummies

Cisco ICND1-certifieringsexamen testa dig kraftigt på OSI modell och de olika protokoll och enheter som körs i varje lager av OSI-modellen. Följande granskar OSI-modellen genom att ge dig en beskrivning av varje lager och exempel på protokoll och enheter som körs i varje lager. Layer Beskrivning Exempel 7. Applikation ...

Redaktörens val

Hur man skalar på skifferelement i kantfilm - dummies

Hur man skalar på skifferelement i kantfilm - dummies

Skalar ett element i Adobe Edge Animate betyder i huvudsak att du kan ändra storleken på ett element samtidigt som dess proportioner hålls konsekventa om du vill. Du kan: Skalelement med verktyget Transform Skalaelement från Egenskaper-panelen Skalning med verktyget Transform Om du föredrar att använda en klicka-och-dra-metod för skalering ...

Hur man arbetar med mallar i Adobe Edge Animate - dummies

Hur man arbetar med mallar i Adobe Edge Animate - dummies

Mallar introducerades i Edge Animate 2. 0. Denna funktion tar bort nödvändigheten att återuppfinna hjulet varje gång du vill starta en ny komposition. Visst kan du alltid starta en ny komposition från en sparad fil, men Mallar gör att du kan starta ett nytt projekt som redan innehåller attribut och element som du vill ha.

Keyframes Modes in Edge Animation - dummies

Keyframes Modes in Edge Animation - dummies

Keyframe-verktyg i Edge Animate finns till höger om Play-kontrollerna. För att skapa nyckelfiler automatiskt måste du först aktivera nyckelbilder genom att klicka på den röda stoppklockans ikon. Som standard, när du startar en ny animering, är Stopwatch rött men har gråa linjer som löper genom det (som visat). Här är standardstatus för ...

Redaktörens val

Hur man tolkar figurativt språk för GED RLA-dummiesna

Hur man tolkar figurativt språk för GED RLA-dummiesna

Författare använder språk antingen bokstavligt eller figurativt . GED Reasoning Through Language Arts testet kommer att ha några frågor för att testa din förmåga att identifiera skillnaden. En NASA-vetenskapsman kan beskriva en asteroid väldigt bokstavligt: ​​består huvudsakligen av vatten, blandat med vissa stenar och mindre fasta fragment. Eller kan han eller hon skriva figurativt och beskriva ...

Hur (och var) ska schemalägga för att ta GED-dummiesna

Hur (och var) ska schemalägga för att ta GED-dummiesna

För att ta GED test, schemalägger du det baserat på tillgängliga testdatum. Varje stat eller lokalt testcenter ställer in sitt eget schema för GED-testet, vilket innebär att ditt tillstånd bestämmer hur och när du kan ta varje avsnitt av testet. Det bestämmer också hur ofta du kan återta en misslyckad ...

Hur man förbereder sig på GED RLA Extended Response - dummies

Hur man förbereder sig på GED RLA Extended Response - dummies

Uppsats för utvidgad respons på GED Reasoning Through Language Arts-testet kräver några mycket specifika färdigheter, allt från grammatik och korrekt språkanvändning till förståelse och analysförmåga. Om du någonsin har haft ett argument om vem som har det bästa laget eller vilken arbetsgivare är bättre, vet du redan hur man bedömer argument och svarar. ...