Hem Personliga finanser Data mining för stora data - dummies

Data mining för stora data - dummies

Video: Kenneth Cukier: Big data is better data 2024

Video: Kenneth Cukier: Big data is better data 2024
Anonim

Data mining innebär att undersöka och analysera stora mängder data för att hitta mönster för stora data. Teknikerna kom ut från statistik och artificiell intelligens (AI), med lite databashantering som kastades i mixen.

Målet för datavinnningen är i allmänhet antingen klassificering eller förutsägelse. I klassificeringen är tanken att sortera data i grupper. Till exempel kan en marknadsförare vara intresserad av egenskaperna hos dem som svarade mot vem som inte svarade på en kampanj.

Det här är två klasser. I förutsägelse är tanken att förutse värdet av en kontinuerlig variabel. En marknadsförare kan till exempel vara intresserad av att förutsäga dem som kommer att svara på en kampanj.

Typiska algoritmer som används vid data mining inkluderar följande:

  • Klassificeringsträd: En populär datautvinningsteknik som används för att klassificera en beroende kategorisk variabel baserat på mätningar av en eller flera prediktorvariabler. Resultatet är ett träd med noder och länkar mellan noder som kan läsas för att bilda om-då regler.

  • Logistisk regression: En statistisk teknik som är en variant av standardregression men utökar konceptet för att hantera klassificering. Den producerar en formel som förutser sannolikheten för förekomsten som en funktion av de oberoende variablerna.

  • Neurala nätverk: En mjukvaralgoritm som modelleras efter djurharts parallella arkitektur. Nätverket består av inmatade noder, dolda lager och utgångsnoder. Varje enhet tilldelas en vikt. Data ges till ingångskoden, och med ett system med försök och fel justerar algoritmen vikterna tills den uppfyller vissa stoppkriterier. Vissa människor har liknat detta till en svart box-strategi.

  • Clusteringsteknik som K-närmaste grannar: En teknik som identifierar grupper av liknande poster. K-närmaste grannteknik beräknar avstånden mellan posten och poängen i den historiska (träningsdata). Den tilldelar sedan denna post till klassen av närmaste granne i en dataset.

Här är ett exempel på klassificeringstree. Tänk på situationen där ett telefonselskap vill bestämma vilka bostadskunder som sannolikt kommer att koppla från sin tjänst.

Telefonföretaget har information som består av följande attribut: hur länge personen har tjänat, hur mycket han spenderar på tjänsten, om tjänsten har varit problematisk, om han har den bästa anropsplanen han behöver, var han lever, hur gammal han är, om han har andra tjänster bundna ihop, konkurrensinformation om andra flygplan, och om han fortfarande har tjänsten.

Du kan naturligtvis hitta många fler attribut än det här. Det sista attributet är utfallsvariabeln; Detta är vad mjukvaran kommer att använda för att klassificera kunderna i en av de två grupperna - kanske kallad stayers och flygrisker.

Datasatsen är uppdelad i träningsdata och en testdatasats. Träningsdata består av observationer (kallade attribut) och en resultatvariabel (binär i fallet med en klassificeringsmodell) - i så fall riskerar stayers eller flygningen.

Algoritmen körs över träningsdata och kommer upp med ett träd som kan läsas som en serie regler. Om kunderna till exempel har varit med i företaget i mer än tio år och de är över 55 år, kommer de sannolikt att förbli lika lojala kunder.

Dessa regler körs sedan över testdatasatsen för att bestämma hur bra den här modellen är på "nya data". "Nätsäkerhetsåtgärder tillhandahålls för modellen. Till exempel är en populär teknik förvirringsmatrisen. Denna matris är en tabell som ger information om hur många fall som var korrekt mot felaktigt klassificerade.

Om modellen ser bra ut, kan den distribueras på andra data, som den är tillgänglig (det vill säga med hjälp av den för att förutsäga nya fall av flygrisk). Baserat på modellen kan företaget exempelvis besluta att skicka ut specialerbjudanden till de kunder som den anser är flygrisker.

Data mining för stora data - dummies

Redaktörens val

Jewish Funeral Traditions - dummies

Jewish Funeral Traditions - dummies

Judiska begravningar sker vanligen i en synagoge, begravningshem eller på en kyrkogård. Med tradition är judiska begravningar enkla (symboliserar tron ​​att människor är alla lika i döden), men de varierar mycket och har ingen uppsättning liturgi. Att skicka blommor till ett begravnings- eller sorgshem är starkt avskräckt i judendomen. Inte bara kommer ...

Identifiera komplicerade grävande dummies

Identifiera komplicerade grävande dummies

Komplicerat roende är det tekniska namnet som sorgproffs ger till en sorgprocess som sitter fast vid något tillfälle , vilket gör det omöjligt för de förlorade att framgångsrikt starta eller avsluta sorgprocessen. Komplicerat sorg är ofta ett tecken på olösta problem i förhållandet mellan de förlorade och den avlidne som gör det ...

Redaktörens val

Hur man ställer in kartkontroller i Main_iPad. Storyboard i din iOS App - dummies

Hur man ställer in kartkontroller i Main_iPad. Storyboard i din iOS App - dummies

När du har en anpassad vy för MapController i din iOS-app, måste du berätta för iPad-storyboardet att du laddar in din anpassade vy i stället för en UIViewController. Följ dessa steg: Välj Projekt navigator genom att välja Main_iPad. storyboard och välj sedan View Controller i View Controller - Map Scene i dokumentutskriften. ...

Hur man roterar objekt i din iOS-app - dummies

Hur man roterar objekt i din iOS-app - dummies

Här hittar du hur man rotera en vy (i så fall vrid bilen runt) i din iOS-app. För att göra det uppdaterar du den roterande kodstuben du startade med och ersätter den med den fetstilta koden. - (void) rotera {CGAffineTransform transform = CGAffineTransformMakeRotation (M_PI); void (^ animation) () = ^ () {self. bil. transformera = transformera; ...

Hur man ställer in en WeatherController i Main_iPad. storyboard-fil för din iOS-app - dummies

Hur man ställer in en WeatherController i Main_iPad. storyboard-fil för din iOS-app - dummies

Bör du lägga till en ny anpassad vykontroll till din iOS-app innan du fortsätter till dessa steg. Du behöver fortfarande berätta för storyboardet att du vill att den ska ladda den nya anpassade vykontrollen istället för en UIViewController. Följ dessa steg:

Redaktörens val

Spara en grafisk stil i Adobe CS5 Illustrator - dummies

Spara en grafisk stil i Adobe CS5 Illustrator - dummies

Adobe Creative Suite 5 (Adobe CS5) Illustrator tillåter Du sparar en grafisk stil. En grafisk stil är en kombination av alla inställningar du väljer för ett visst filter eller en effekt i Utseendepanelen. Genom att spara informationen i en grafisk stil lagras du dessa attribut så att du snabbt och enkelt kan tillämpa ...

Välj som ett transformationsverktyg i Adobe CS5 Illustrator - dummies

Välj som ett transformationsverktyg i Adobe CS5 Illustrator - dummies

I Adobe Creative Suite 5 (Adobe CS5 ) Illustratör du kan använda markeringsverktyget för att skala och rotera ett valt objekt. Dra begränsningsboxens handtag för att ändra storlek på objektet, eller flytta dig utanför ett handtag och sedan, när markören ändras till en flippig pil (en böjd pil med pilhuvud i båda ändarna), dra till ...

Objekttransformation i Adobe CS5 Illustrator - dummies

Objekttransformation i Adobe CS5 Illustrator - dummies

Verktygen Rotate, Reflect, Scale och Shear i Adobe Creative Suite 5 (Adobe CS5) Illustrator använder alla samma grundläggande steg för att utföra transformationer. Här är fem sätt att transformera ett objekt: en för en godtycklig omvandling och fyra andra för exakta omvandlingar baserat på en numerisk mängd som du anger. Vilkårlig omvandlingsmetod Eftersom detta ...