Hem Personliga finanser Fas 4 av CRISP-DM Processmodellen: Modellering - dummies

Fas 4 av CRISP-DM Processmodellen: Modellering - dummies

Innehållsförteckning:

Video: RESUMEN | FAS 4-1 El Vencedor | Jornada 16 Apertura 2019 2025

Video: RESUMEN | FAS 4-1 El Vencedor | Jornada 16 Apertura 2019 2025
Anonim

Modellering är en del av processmodellen Cross-Industry Standard Process for Data Mining (CRISP-DM) gruvarbetare som bäst. Dina data är redan i god form, och nu kan du söka efter användbara mönster i dina data.

Modelleringsfasen innehåller fyra uppgifter. Dessa är

  • Val av modelleringstekniker

  • Utformning av test (er)

  • Byggnadsmodeller

  • Bedömning av modeller

Uppgift: Val av modelleringsteknik

Den underbara världen av data mining erbjuder modeller av modelleringstekniker, men inte alla kommer att passa dina behov. Begränsa listan baserat på de olika typerna av variabler, valet av tekniker som finns tillgängliga i dina verktyg och eventuella affärsmässiga överväganden som är viktiga för dig.

Till exempel föredrar många organisationer metoder med utdata som är lätta att tolka, så besluts träd eller logistisk regression kan vara acceptabelt, men neurala nätverk skulle antagligen inte accepteras.

Leveranserna för den här uppgiften inkluderar två rapporter:

  • Modelingsteknik: Ange de tekniker som du ska använda.

  • Modelleringsantaganden: Många modelleringstekniker bygger på vissa antaganden. Exempelvis kan en modelltyp vara avsedd för användning med data som har en specifik typ av distribution. Dokumentera dessa antaganden i denna rapport.

Statistiker är välinformerade, strikta och noga med antaganden. Det är inte nödvändigtvis sant för datavinnare, och det är inte ett krav att bli dataingruvare. Om du har djup statistisk kunskap och förstår antagandena bakom de modeller du väljer kan du vara strikt och noga om antaganden.

Men många datavinnare, speciellt nybörjare data minare, bråkar inte mycket över antaganden. Alternativet testar - mycket och mycket testning - av dina modeller.

Uppgift: Utformning av test

Testet i den här uppgiften är det test som du ska använda för att bestämma hur bra din modell fungerar. Det kan vara så enkelt att dela upp dina data i en grupp fall för modellutbildning och en annan grupp för modelltestning.

Träningsdata används för att passa matematiska formulär till datamodellen, och testdata används under modellutbildningen för att undvika övermontering: gör en modell som är perfekt för en dataset men ingen annan. Du kan också använda holdout data, data som inte används under modellutbildningen, för ett ytterligare test.

Den leveransbara för denna uppgift är din testdesign. Det behöver inte vara noggrant, men du bör åtminstone ta hand om att dina tränings- och testdata är likartade och att du undviker att införa någon bias i data.

Uppgift: Byggnadsmodeller

Modellering är det som många människor föreställer sig att vara datainställarens hela jobb, men det är bara en uppgift av dussintals! Modellering för att ta itu med specifika affärsmål är dock hjärtat i datavinnningsindustrin.

Leveranserna för den här uppgiften inkluderar tre punkter:

  • Parameterinställningar: När du bygger modeller ger de flesta verktyg möjlighet att justera en mängd olika inställningar och dessa inställningar påverkar strukturen hos den slutliga modellen. Dokumentera dessa inställningar i en rapport.

  • Modellbeskrivningar: Beskriv dina modeller. Ange typ av modell (t.ex. linjär regression eller neuralt nätverk) och variablerna som används. Förklara hur modellen tolkas. Dokumentera eventuella problem som uppstått vid modelleringsprocessen.

  • Modeller: Denna leverans är modellerna själva. Vissa modelltyper kan enkelt definieras med en enkel ekvation; Andra är alltför komplexa och måste överföras i ett mer sofistikerat format.

Uppgift: Bedömning av modeller

Nu kommer du att granska de modeller du skapat, både tekniskt och affärsmässigt (ofta med inmatning från företagsexperter på ditt projektteam).

Leveranser för denna uppgift innehåller två rapporter:

  • Modellbedömning: Sammanfattar informationen som utvecklats i din modellgranskning. Om du har skapat flera modeller kan du rangordna dem baserat på din bedömning av deras värde för en specifik applikation.

  • Ändrade parameterinställningar: Du kan välja att finjustera inställningar som användes för att bygga modellen och genomföra en annan modellrunda och försöka förbättra dina resultat.

Data mining, som en lök, en Dobos torte, eller en sedimentär rock, har massor av lager. När du bara har börjat i datautvinning kan du börja med att lämna parametervärdena till standardvärdena (i själva verket kanske du inte ens märker alternativ om du inte försöker söka efter dem).

När du blir bekväm i din nya data mining karriär, är det meningsfullt att du får reda på modellparametrar och vet hur du kan använda dem. Dina alternativ varierar mycket med typen av modell och specifikt verktyg som du använder.

Fas 4 av CRISP-DM Processmodellen: Modellering - dummies

Redaktörens val

Hur man korrigerar vanliga försäljningsfel i QuickBooks 2015 - dummies

Hur man korrigerar vanliga försäljningsfel i QuickBooks 2015 - dummies

Om du gör ett misstag i ange ett kvitto (kontantförsäljning) i QuickBooks 2015, oroa dig inte. De flesta fel har enkla lösningar. Här är en lista över vanliga problem och hur man fixar dem: Om försäljningskvittot fortfarande visas på skärmen: Om försäljningskvittot fortfarande är på skärmen kan du flytta markören till ...

Hur man skapar en revisors kopia av din QuickBooks 2010 datafil - dummies

Hur man skapar en revisors kopia av din QuickBooks 2010 datafil - dummies

QuickBooks 2010 gör det enkelt för revisorer att arbeta med klientdatafiler. Du kan använda Accountant's Copy-funktionen i QuickBooks för att helt enkelt e-posta (eller snail-mail) din revisor en kopia av QuickBooks-datafilen. Du skapar revisorns kopia av QuickBooks datafil genom att använda din version av QuickBooks och den verkliga ...

Hur man skapar en ny budget i QuickBooks - dummies

Hur man skapar en ny budget i QuickBooks - dummies

När du har kommit överens med en budget Med hjälp av vissa budgeteringsmetoder registrerar du din budget i QuickBooks. Om du vill skapa en ny budget i QuickBooks följer du dessa steg:

Redaktörens val

ÖVersätt Twitter Slang och Jargon - dummies

ÖVersätt Twitter Slang och Jargon - dummies

Diskussioner om och om Twitter är fulla med alla slags förkortningar och jargong som kan förvirra nya Twitter-användare. Vad talar folk om (och tweeting) om? Följande ordlista definierar några av de förvirrande förkortningarna och Twitter-lingo du kan komma över. AFAIK: Så vitt jag vet. bot: Ett konto som drivs av en ...

Vad är Letgo? - dummies

Vad är Letgo? - dummies

Letgo är en mobil klassificerad applikation som tillåter användare att köpa från och sälja till andra lokalt. Du kan använda Letgo till fyndbutik eller slutligen släppa på saker som samlar damm runt ditt hus. I likhet med andra classifieds-applikationer som Wallapop eller Craigslist kommer säljare att skicka ett objekt och vänta på en köpare ...

Vad är Bebo? - dummies

Vad är Bebo? - dummies

Innan Facebook gick i centrum, var Bebo en av de mest populära på de sociala nätverkssidorna. Tillbaka i mitten av 1990-talet kanske några av er kommer ihåg Bebo. Den här webbplatsen har utvecklats och lanserats under MySpace och Hi5s dagar när socialt nätverkande först skedde i Internetgemenskapen. AOL: s 850 miljoner ...

Redaktörens val

Ser ut för makrovirus i Office 2003 - dummies

Ser ut för makrovirus i Office 2003 - dummies

Microsoft Office 2003 ger dig två sätt att skapa en makro. Det enklaste sättet är att spela in dina tangenttryckningar och sedan spela upp dem när du behöver dem. Det hårdare sättet att skapa ett makro är att använda Microsofts speciella makroprogrammeringsspråk (kallat Visual Basic for Applications eller VBA) för att skapa kraftfullare ...

Tio Office 2013 Snabbkommandon - dummies

Tio Office 2013 Snabbkommandon - dummies

Ett vanligt tema för Office 2013 är att alla program ser ut och fungerar lika. När du har läst hur du använder Word hittar du det inte mycket svårare att lära sig Excel eller PowerPoint eftersom flikflikarna alla fungerar på liknande sätt. Ännu bättre, samma tangentkommandon fungerar lika i alla Office 2013-program. Vid ...

Vad är kontorsmallar? - dummies

Vad är kontorsmallar? - dummies

Microsoft Word är det mest populära i Office 2013-programmen eftersom nästan alla behöver skapa textdokument av en eller annan typ. Med Word kan du skapa allt från faxöverdragsark till skolböcker till familjesemestrar. Du kan skapa ett tomt nytt dokument, eller du kan basera ett nytt ...