Innehållsförteckning:
- Upptäcka bedrägeri
- Från de tidigaste dagarna av kommersiell databehandling har det varit ett stort intresse för att utveckla "tänkande maskiner" som kan bearbeta stora mängder data och fatta beslut utifrån den analysen.
- Utan en statistisk bakgrund kan du hitta mycket av datavinnningen förvirrande. Du måste göra mycket arbete för att träna algoritmerna och bygga reglerna för att säkerställa rätt resultat med större dataset. Om du antar att du är bekväm med det här konceptet eller har en kollega som kan hjälpa, här är några av de mer omfattande algoritmerna:
Video: Data Mining: How You're Revealing More Than You Think 2024
Kännetecknande för data mining, jämfört med fråga, rapportering eller till och med OLAP, är att du kan få information utan att behöva ställa specifika frågor.
Data mining tjänar två primära roller i ditt företagsintelligensuppdrag:
-
"Berätta för mig vad som kan hända" roll: Data miningens första roll är prediktiv, där du i princip säger "Berätta för mig vad kan hända. "Med hjälp av dold kunskap som är låst i ditt datalager, är sannolikheter och sannolikheten för framtida trender och händelser frilagda och presenterade för dig.
-
Den "Berätta för mig något intressant" roll: Förutom eventuella framtida händelser och händelser, försöker datautvinning också att ta fram intressanta uppgifter som du förmodligen borde veta om, till exempel en speciell ovanligt samband mellan försäljning av två olika produkter och hur det förhållandet varierar beroende på placering i dina butiker.
Även om många av dessa intressanta prenumeranter sannolikt kommer att finnas, vilka frågor skulle du fråga om du använde ett frågetecken eller OLAP-verktyg, och hur skulle du tolka resultaten? Data mining hjälper dig i denna krävande uppgift att ta reda på vilka frågor som ska ställas genom att göra mycket av det stora arbetet för dig.
Upptäcka bedrägeri
Bestämning av effektivitet på marknadsföringsprogrammet
-
Välja vem, från en stor kundbas eller den allmänna befolkningen bör du rikta dig som en del av ett marknadsföringsprogram
-
Hantera kundens livscykel, inklusive kundbevarande uppdrag
-
Utför avancerad affärsmodell och vad-om-scenarier
Tänk på vad som ligger bakom varje affärsuppdrag i föregående lista: -
En stor mängd data
En ännu större antal kombinationer av olika delar av data
-
Intensiv resultatanalys, vanligtvis involverade komplexa algoritmer och avancerade statistiska tekniker
-
Tänk nu på vad du skulle behöva om du använde ett rapporterings- eller OLAP-verktyg för att uppnå dessa uppdrag. Du skulle tycka att det var praktiskt taget omöjligt att genomföra någon av de föregående uppdragna om du var tvungen att ställa en fråga och få ett resultat, fråga en annan fråga och få ett annat resultat, och fortsätt sedan att repetera dessa steg.
-
Datautvinning och artificiell intelligens
Om du har varit i IT-fältet i minst ett decennium kan vissa av de föregående termerna vara vettigt bekanta.Lås upp dold kunskap? Prediktiv funktionalitet? Vänta en minut - det är artificiell intelligens!
Från de tidigaste dagarna av kommersiell databehandling har det varit ett stort intresse för att utveckla "tänkande maskiner" som kan bearbeta stora mängder data och fatta beslut utifrån den analysen.
Intresset för artificiell intelligens (AI) slog sin zenit i mitten av 1980-talet. Vid den tiden arbetade databasleverantörerna med att producera kunskapsbasstyrningssystem (KBMS); Andra leverantörer kom ut med
expertsystemskalar, eller AI-baserade applikationsutvecklingsramar som använde tekniker som framåtkedjning och bakåtkedjning för att ge användarna råd om beslut. och neurala nätverk placerades som nästa stora AI-utveckling. Intresset för AI avtog i början av 1990-talet, när förväntningarna överträffade tillgängliga möjligheter och andra frenzymer, som klient / server migration och (självklart) datalagring, tog centrum. Nu är AI tillbaka!
Den högsta profilerade AI-tekniken som används vid datautvinning är neurala nätverk. Neurala nät var ursprungligen tänkt som en behandlingsmodell som skulle efterlikna hur människans hjärna löser problem, med hjälp av neuroner och mycket parallell bearbetning för att lösa mönstret.
Det är en naturlig match att tillämpa neurala nätverksalgoritmer på områdena affärsintelligens som data mining hanterar (igen, prediktiv och "berätta för mig något intressant" uppdrag).
Även om data mining / neuralt nätverk spel är definitivt värt att checka in, bör du göra det noggrant. Du kan hitta en massa intressanta och spännande tekniker som, i händerna på dem som inte förstår algoritmerna, sannolikt kommer att misslyckas.
Med rätt kunskap och utbildning kan du dock göra ett fullskaligt engagemang för att få denna typ av bearbetning till ditt affärsinformationsramverk som teknisk analysparning för OLAP-fokuserad affärsanalys.
Data mining och statistik
Den mer mogna delen av data mining är tillämpningen av avancerade statistiska tekniker mot de stora datamängderna i ditt datalager. Olika verktyg använder olika typer av statistiska tekniker, skräddarsydda för de specifika områden de försöker adressera.
Utan en statistisk bakgrund kan du hitta mycket av datavinnningen förvirrande. Du måste göra mycket arbete för att träna algoritmerna och bygga reglerna för att säkerställa rätt resultat med större dataset. Om du antar att du är bekväm med det här konceptet eller har en kollega som kan hjälpa, här är några av de mer omfattande algoritmerna:
Klassificeringsalgoritmer:
Förutsätta en eller flera diskreta variabler, baserat på den andra attribut i datamängden. Genom att använda klassificeringsalgoritmer kan datautvinningsverktyget titta på stora mängder data och informera dig om att "Kunder som behålls genom minst två generationer av produktköp tenderar att ha dessa egenskaper: De har en inkomst på minst $ 75 000, och de äger egna hem."
-
Regressionsalgoritmer: Förutse en eller flera kontinuerliga variabler, till exempel vinst eller förlust, baserat på andra attribut i datasetet. Regressionsalgoritmer drivs genom historisk information som presenteras för datautvinningsverktyget "över tiden", bättre känd som
-
tidsserier information. Segmenteringsalgoritmer: Dela data i grupper eller kluster av objekt som har liknande egenskaper.
-
Förbundsalgoritmer: Hitta korrelationer mellan olika attribut i en dataset. Den vanligaste tillämpningen av denna typ av algoritm skapar associeringsregler, som du kan använda i en marknadskorgsanalys. Observera att till exempel om en kund köper ett visst programpaket, har han eller hon 65 procent chans att köpa minst två produktspecifika tilläggspaket inom två veckor.
-
Sekvensanalysalgoritmer: Sammanfatta frekventa sekvenser eller episoder i data, såsom ett flöde på webbanor.
-
Många fler metoder finns. Stoppa av den gamla statistikboken och börja läsa.