Hem Personliga finanser Data mining - dummies

Data mining - dummies

Innehållsförteckning:

Video: Data Mining: How You're Revealing More Than You Think 2024

Video: Data Mining: How You're Revealing More Than You Think 2024
Anonim

Kännetecknande för data mining, jämfört med fråga, rapportering eller till och med OLAP, är att du kan få information utan att behöva ställa specifika frågor.

Data mining tjänar två primära roller i ditt företagsintelligensuppdrag:

  • "Berätta för mig vad som kan hända" roll: Data miningens första roll är prediktiv, där du i princip säger "Berätta för mig vad kan hända. "Med hjälp av dold kunskap som är låst i ditt datalager, är sannolikheter och sannolikheten för framtida trender och händelser frilagda och presenterade för dig.

  • Den "Berätta för mig något intressant" roll: Förutom eventuella framtida händelser och händelser, försöker datautvinning också att ta fram intressanta uppgifter som du förmodligen borde veta om, till exempel en speciell ovanligt samband mellan försäljning av två olika produkter och hur det förhållandet varierar beroende på placering i dina butiker.

    Även om många av dessa intressanta prenumeranter sannolikt kommer att finnas, vilka frågor skulle du fråga om du använde ett frågetecken eller OLAP-verktyg, och hur skulle du tolka resultaten? Data mining hjälper dig i denna krävande uppgift att ta reda på vilka frågor som ska ställas genom att göra mycket av det stora arbetet för dig.

Upptäcka bedrägeri

Bestämning av effektivitet på marknadsföringsprogrammet

  • Välja vem, från en stor kundbas eller den allmänna befolkningen bör du rikta dig som en del av ett marknadsföringsprogram

  • Hantera kundens livscykel, inklusive kundbevarande uppdrag

  • Utför avancerad affärsmodell och vad-om-scenarier

    Tänk på vad som ligger bakom varje affärsuppdrag i föregående lista:
  • En stor mängd data

En ännu större antal kombinationer av olika delar av data

  • Intensiv resultatanalys, vanligtvis involverade komplexa algoritmer och avancerade statistiska tekniker

  • Tänk nu på vad du skulle behöva om du använde ett rapporterings- eller OLAP-verktyg för att uppnå dessa uppdrag. Du skulle tycka att det var praktiskt taget omöjligt att genomföra någon av de föregående uppdragna om du var tvungen att ställa en fråga och få ett resultat, fråga en annan fråga och få ett annat resultat, och fortsätt sedan att repetera dessa steg.

  • Datautvinning och artificiell intelligens

Om du har varit i IT-fältet i minst ett decennium kan vissa av de föregående termerna vara vettigt bekanta.Lås upp dold kunskap? Prediktiv funktionalitet? Vänta en minut - det är artificiell intelligens!

Från de tidigaste dagarna av kommersiell databehandling har det varit ett stort intresse för att utveckla "tänkande maskiner" som kan bearbeta stora mängder data och fatta beslut utifrån den analysen.

Intresset för artificiell intelligens (AI) slog sin zenit i mitten av 1980-talet. Vid den tiden arbetade databasleverantörerna med att producera kunskapsbasstyrningssystem (KBMS); Andra leverantörer kom ut med

expertsystemskalar, eller AI-baserade applikationsutvecklingsramar som använde tekniker som framåtkedjning och bakåtkedjning för att ge användarna råd om beslut. och neurala nätverk placerades som nästa stora AI-utveckling. Intresset för AI avtog i början av 1990-talet, när förväntningarna överträffade tillgängliga möjligheter och andra frenzymer, som klient / server migration och (självklart) datalagring, tog centrum. Nu är AI tillbaka!

Den högsta profilerade AI-tekniken som används vid datautvinning är neurala nätverk. Neurala nät var ursprungligen tänkt som en behandlingsmodell som skulle efterlikna hur människans hjärna löser problem, med hjälp av neuroner och mycket parallell bearbetning för att lösa mönstret.

Det är en naturlig match att tillämpa neurala nätverksalgoritmer på områdena affärsintelligens som data mining hanterar (igen, prediktiv och "berätta för mig något intressant" uppdrag).

Även om data mining / neuralt nätverk spel är definitivt värt att checka in, bör du göra det noggrant. Du kan hitta en massa intressanta och spännande tekniker som, i händerna på dem som inte förstår algoritmerna, sannolikt kommer att misslyckas.

Med rätt kunskap och utbildning kan du dock göra ett fullskaligt engagemang för att få denna typ av bearbetning till ditt affärsinformationsramverk som teknisk analysparning för OLAP-fokuserad affärsanalys.

Data mining och statistik

Den mer mogna delen av data mining är tillämpningen av avancerade statistiska tekniker mot de stora datamängderna i ditt datalager. Olika verktyg använder olika typer av statistiska tekniker, skräddarsydda för de specifika områden de försöker adressera.

Utan en statistisk bakgrund kan du hitta mycket av datavinnningen förvirrande. Du måste göra mycket arbete för att träna algoritmerna och bygga reglerna för att säkerställa rätt resultat med större dataset. Om du antar att du är bekväm med det här konceptet eller har en kollega som kan hjälpa, här är några av de mer omfattande algoritmerna:

Klassificeringsalgoritmer:

Förutsätta en eller flera diskreta variabler, baserat på den andra attribut i datamängden. Genom att använda klassificeringsalgoritmer kan datautvinningsverktyget titta på stora mängder data och informera dig om att "Kunder som behålls genom minst två generationer av produktköp tenderar att ha dessa egenskaper: De har en inkomst på minst $ 75 000, och de äger egna hem."

  • Regressionsalgoritmer: Förutse en eller flera kontinuerliga variabler, till exempel vinst eller förlust, baserat på andra attribut i datasetet. Regressionsalgoritmer drivs genom historisk information som presenteras för datautvinningsverktyget "över tiden", bättre känd som

  • tidsserier information. Segmenteringsalgoritmer: Dela data i grupper eller kluster av objekt som har liknande egenskaper.

  • Förbundsalgoritmer: Hitta korrelationer mellan olika attribut i en dataset. Den vanligaste tillämpningen av denna typ av algoritm skapar associeringsregler, som du kan använda i en marknadskorgsanalys. Observera att till exempel om en kund köper ett visst programpaket, har han eller hon 65 procent chans att köpa minst två produktspecifika tilläggspaket inom två veckor.

  • Sekvensanalysalgoritmer: Sammanfatta frekventa sekvenser eller episoder i data, såsom ett flöde på webbanor.

  • Många fler metoder finns. Stoppa av den gamla statistikboken och börja läsa.

Data mining - dummies

Redaktörens val

Hur man lägger till text i en sätter () Funktion i C Programmering

Hur man lägger till text i en sätter () Funktion i C Programmering

När du behöver visa en annan textrad, använd C-programmeringsfärdigheterna för att skapa en annan puts () -funktion i källkoden, som visas i Visa två textlinjer. VISA TILL TEXTFINER # inkludera int main () {sätter ("Hickory, Dickory, Dock,"); sätter ("musen sprang klockan."); returnera (0);} Den andra ...

Förklarar variabler i C-dummies

Förklarar variabler i C-dummies

Variabler är det som gör dina program zooma. Programmering kan bara inte bli gjort utan dem. Så om du inte har introducerats till variabler än, här går du. Valerie Variable är en numerisk variabel. Hon älskar att hålla nummer - vilket nummer som helst; det spelar ingen roll. När hon ser ett lika tecken tar hon ett värde och ...

Redaktörens val

Gör rädsla för din vän - dummies

Gör rädsla för din vän - dummies

Rädsla är lika verklig som mod. Även om värdet av rädsla inte är lika uppenbart som modets värde, har det dess fördelar. Rädsla är din instinkt som säger att du är obehaglig - även om situationen inte kommer att skada dig. Alla har haft den känslan när man hellre drar locket ...

Hur man ökar din självmedvetenhet - dummies

Hur man ökar din självmedvetenhet - dummies

Du kommer att vara med dig själv under en livstid. Ingenting kommer att förändra det faktum. Att lära känna, som att lyssna på och uppskatta själv är avgörande för din sanity. Kanske kommer du till att älska, acceptera och omfamna alla du är, är svår för dig att föreställa dig just nu, men du kan göra ...

Hur man ökar din mentala flexibilitet - dummies

Hur man ökar din mentala flexibilitet - dummies

ÄR flexibel i arbete och relationer är ett tecken på en högpresterande. Medan perfektionister är styva och obehagliga i sitt arbete och hur de interagerar med andra, är högpresterande mer öppna och tillmötesgående. Att vara mer flexibel på jobbet gav Ralph aldrig förslag under brainstorming vid gruppmöten. Han kände att hans lag ...

Redaktörens val

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Linux är i sig ett kommandoradsorienterat operativsystem. Grafiska användargränssnitt - inklusive installationsprogrammets GUI - tillhandahålls av en valfri komponent som heter X Window System. Men medan du arbetar med det grafiska användargränssnittet för installationsprogrammet, håller Linux flera ytterligare kommandorads-konsoler öppna. Normalt behöver du inte ...

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Alla användare som åtkomst ett Linux-system, lokalt eller över ett nätverk, måste verifieras av ett giltigt användarkonto på systemet. I det följande får du veta hur du loggar in och ut på ett Linux-system och hur du stänger av systemet. Logga in När Linux startar upp visas det ...

Nätverksadministration: Licensserver - Dummies

Nätverksadministration: Licensserver - Dummies

I vissa program kan du köpa nätverkslicenser som gör att du kan installera programvaran på många datorer som du vill, men reglera antalet personer som kan använda programvaran vid en viss tidpunkt. För att styra hur många som använder programvaran, är en särskild licensserver inrättad. När en användare börjar ...