Hem Personliga finanser Fas 4 av CRISP-DM Processmodellen: Modellering - dummies

Fas 4 av CRISP-DM Processmodellen: Modellering - dummies

Innehållsförteckning:

Video: RESUMEN | FAS 4-1 El Vencedor | Jornada 16 Apertura 2019 2024

Video: RESUMEN | FAS 4-1 El Vencedor | Jornada 16 Apertura 2019 2024
Anonim

Modellering är en del av processmodellen Cross-Industry Standard Process for Data Mining (CRISP-DM) gruvarbetare som bäst. Dina data är redan i god form, och nu kan du söka efter användbara mönster i dina data.

Modelleringsfasen innehåller fyra uppgifter. Dessa är

  • Val av modelleringstekniker

  • Utformning av test (er)

  • Byggnadsmodeller

  • Bedömning av modeller

Uppgift: Val av modelleringsteknik

Den underbara världen av data mining erbjuder modeller av modelleringstekniker, men inte alla kommer att passa dina behov. Begränsa listan baserat på de olika typerna av variabler, valet av tekniker som finns tillgängliga i dina verktyg och eventuella affärsmässiga överväganden som är viktiga för dig.

Till exempel föredrar många organisationer metoder med utdata som är lätta att tolka, så besluts träd eller logistisk regression kan vara acceptabelt, men neurala nätverk skulle antagligen inte accepteras.

Leveranserna för den här uppgiften inkluderar två rapporter:

  • Modelingsteknik: Ange de tekniker som du ska använda.

  • Modelleringsantaganden: Många modelleringstekniker bygger på vissa antaganden. Exempelvis kan en modelltyp vara avsedd för användning med data som har en specifik typ av distribution. Dokumentera dessa antaganden i denna rapport.

Statistiker är välinformerade, strikta och noga med antaganden. Det är inte nödvändigtvis sant för datavinnare, och det är inte ett krav att bli dataingruvare. Om du har djup statistisk kunskap och förstår antagandena bakom de modeller du väljer kan du vara strikt och noga om antaganden.

Men många datavinnare, speciellt nybörjare data minare, bråkar inte mycket över antaganden. Alternativet testar - mycket och mycket testning - av dina modeller.

Uppgift: Utformning av test

Testet i den här uppgiften är det test som du ska använda för att bestämma hur bra din modell fungerar. Det kan vara så enkelt att dela upp dina data i en grupp fall för modellutbildning och en annan grupp för modelltestning.

Träningsdata används för att passa matematiska formulär till datamodellen, och testdata används under modellutbildningen för att undvika övermontering: gör en modell som är perfekt för en dataset men ingen annan. Du kan också använda holdout data, data som inte används under modellutbildningen, för ett ytterligare test.

Den leveransbara för denna uppgift är din testdesign. Det behöver inte vara noggrant, men du bör åtminstone ta hand om att dina tränings- och testdata är likartade och att du undviker att införa någon bias i data.

Uppgift: Byggnadsmodeller

Modellering är det som många människor föreställer sig att vara datainställarens hela jobb, men det är bara en uppgift av dussintals! Modellering för att ta itu med specifika affärsmål är dock hjärtat i datavinnningsindustrin.

Leveranserna för den här uppgiften inkluderar tre punkter:

  • Parameterinställningar: När du bygger modeller ger de flesta verktyg möjlighet att justera en mängd olika inställningar och dessa inställningar påverkar strukturen hos den slutliga modellen. Dokumentera dessa inställningar i en rapport.

  • Modellbeskrivningar: Beskriv dina modeller. Ange typ av modell (t.ex. linjär regression eller neuralt nätverk) och variablerna som används. Förklara hur modellen tolkas. Dokumentera eventuella problem som uppstått vid modelleringsprocessen.

  • Modeller: Denna leverans är modellerna själva. Vissa modelltyper kan enkelt definieras med en enkel ekvation; Andra är alltför komplexa och måste överföras i ett mer sofistikerat format.

Uppgift: Bedömning av modeller

Nu kommer du att granska de modeller du skapat, både tekniskt och affärsmässigt (ofta med inmatning från företagsexperter på ditt projektteam).

Leveranser för denna uppgift innehåller två rapporter:

  • Modellbedömning: Sammanfattar informationen som utvecklats i din modellgranskning. Om du har skapat flera modeller kan du rangordna dem baserat på din bedömning av deras värde för en specifik applikation.

  • Ändrade parameterinställningar: Du kan välja att finjustera inställningar som användes för att bygga modellen och genomföra en annan modellrunda och försöka förbättra dina resultat.

Data mining, som en lök, en Dobos torte, eller en sedimentär rock, har massor av lager. När du bara har börjat i datautvinning kan du börja med att lämna parametervärdena till standardvärdena (i själva verket kanske du inte ens märker alternativ om du inte försöker söka efter dem).

När du blir bekväm i din nya data mining karriär, är det meningsfullt att du får reda på modellparametrar och vet hur du kan använda dem. Dina alternativ varierar mycket med typen av modell och specifikt verktyg som du använder.

Fas 4 av CRISP-DM Processmodellen: Modellering - dummies

Redaktörens val

Nätverksenheter och tjänster Översikt för certifikatprov på CCENT-dummies

Nätverksenheter och tjänster Översikt för certifikatprov på CCENT-dummies

Du kan vara säker på att få några frågor om certifieringsexamen som testar din kunskap om typer av enheter och olika nätverkstjänster. Nedan följer några viktiga punkter att komma ihåg om enheter och tjänster: Nätverksenheter Hubb: Ett nav är en lag 1-enhet som används för att ansluta system tillsammans. När ...

OSI-modell för CCENT-certifieringsexamen - dummies

OSI-modell för CCENT-certifieringsexamen - dummies

Certifieringen certifierar dig kraftigt på OSI-modellen och olika protokoll och enheter som körs på varje lager av OSI-modellen. I följande tabell granskas OSI-modellen genom att ge dig en beskrivning av varje lager och exempel på protokoll och enheter som körs i varje lager. Layer Beskrivning Exempel 7. Applikation ...

OSI-modell för Cisco ICND1-certifieringsexamen - dummies

OSI-modell för Cisco ICND1-certifieringsexamen - dummies

Cisco ICND1-certifieringsexamen testa dig kraftigt på OSI modell och de olika protokoll och enheter som körs i varje lager av OSI-modellen. Följande granskar OSI-modellen genom att ge dig en beskrivning av varje lager och exempel på protokoll och enheter som körs i varje lager. Layer Beskrivning Exempel 7. Applikation ...

Redaktörens val

Hur man skalar på skifferelement i kantfilm - dummies

Hur man skalar på skifferelement i kantfilm - dummies

Skalar ett element i Adobe Edge Animate betyder i huvudsak att du kan ändra storleken på ett element samtidigt som dess proportioner hålls konsekventa om du vill. Du kan: Skalelement med verktyget Transform Skalaelement från Egenskaper-panelen Skalning med verktyget Transform Om du föredrar att använda en klicka-och-dra-metod för skalering ...

Hur man arbetar med mallar i Adobe Edge Animate - dummies

Hur man arbetar med mallar i Adobe Edge Animate - dummies

Mallar introducerades i Edge Animate 2. 0. Denna funktion tar bort nödvändigheten att återuppfinna hjulet varje gång du vill starta en ny komposition. Visst kan du alltid starta en ny komposition från en sparad fil, men Mallar gör att du kan starta ett nytt projekt som redan innehåller attribut och element som du vill ha.

Keyframes Modes in Edge Animation - dummies

Keyframes Modes in Edge Animation - dummies

Keyframe-verktyg i Edge Animate finns till höger om Play-kontrollerna. För att skapa nyckelfiler automatiskt måste du först aktivera nyckelbilder genom att klicka på den röda stoppklockans ikon. Som standard, när du startar en ny animering, är Stopwatch rött men har gråa linjer som löper genom det (som visat). Här är standardstatus för ...

Redaktörens val

Hur man tolkar figurativt språk för GED RLA-dummiesna

Hur man tolkar figurativt språk för GED RLA-dummiesna

Författare använder språk antingen bokstavligt eller figurativt . GED Reasoning Through Language Arts testet kommer att ha några frågor för att testa din förmåga att identifiera skillnaden. En NASA-vetenskapsman kan beskriva en asteroid väldigt bokstavligt: ​​består huvudsakligen av vatten, blandat med vissa stenar och mindre fasta fragment. Eller kan han eller hon skriva figurativt och beskriva ...

Hur (och var) ska schemalägga för att ta GED-dummiesna

Hur (och var) ska schemalägga för att ta GED-dummiesna

För att ta GED test, schemalägger du det baserat på tillgängliga testdatum. Varje stat eller lokalt testcenter ställer in sitt eget schema för GED-testet, vilket innebär att ditt tillstånd bestämmer hur och när du kan ta varje avsnitt av testet. Det bestämmer också hur ofta du kan återta en misslyckad ...

Hur man förbereder sig på GED RLA Extended Response - dummies

Hur man förbereder sig på GED RLA Extended Response - dummies

Uppsats för utvidgad respons på GED Reasoning Through Language Arts-testet kräver några mycket specifika färdigheter, allt från grammatik och korrekt språkanvändning till förståelse och analysförmåga. Om du någonsin har haft ett argument om vem som har det bästa laget eller vilken arbetsgivare är bättre, vet du redan hur man bedömer argument och svarar. ...