Hem Personliga finanser Siktar ut de data du behöver - dummies

Siktar ut de data du behöver - dummies

Innehållsförteckning:

Video: ShotKam: Answering Your Questions & Full Overview Of The Camera 2024

Video: ShotKam: Answering Your Questions & Full Overview Of The Camera 2024
Anonim

När du är datautvinning, kommer du ibland att ha mer data än vad du behöver för ett visst projekt. Så här parar du bara till vad du behöver.

Begränsa fälten

När du har många variabler i en dataset kan det vara svårt att hitta eller se de som intresserar dig. Och om dina dataset är stora, och du inte behöver alla variablerna, drar extrafunktionerna i onödan. Så, ibland behöver du behålla vissa variabler och släppa andra. Figuren visar ett exempel i KNIME, där rätt verktyg kallas kolumnfilter.

Ett exempel på inställningen för det här verktyget visas i följande bild.

För att begränsa fälten, leta efter ett verktyg för variabelval i din data mining applikation; Dessa finns med andra verktyg för dataprofilering. Som med andra data-miningverktyg varierar namnen från produkt till produkt. Leta efter variationer på orden kolumn, variabel, eller , och urval eller filtrering.

Val av relevanta fall

Fodral med ofullständig data kan filtreras bort innan du bygger modellen. Att ta bort ofullständiga fall är ett vanligt exempel på dataval eller filtrering.

Men hur skulle du välja endast relevanta fall för varje segment som intresserar dig? Du skulle använda ett datavalningsverktyg.

Följande bild visar ett datavalverktyg i en annan data-miningapplikation.

Nästa bild visar hur du ställer in verktyget för en annan typ av val, den här baserad på värdet på en variabel.

Det är vanligt att använda denna typ av dataval, och vissa applikationer ger alla möjliga inbyggda funktioner för att hjälpa dig att definiera exakt de fall du vill ha. Den här har några exceptionella funktioner; Den visar sammanfattande statistik för variabeln och berättar exakt hur många fall som uppfyller urvalskriterierna.

De flesta applikationer för datautvinning har verktyg för att välja bara de fall du behöver. Se i menyerna (eller sök) för välj eller filter.

Provtagning

En populär uppfattning idag är att mer data är bättre data. Det här är inte en ny idé. Data-mining applikationer har alltid utvecklats för att arbeta med stora mängder data. Även namnet "data mining" föreslår stora mängder. Men ofta med att arbeta med ett urval av dina data kommer du att ge information som är lika användbar, göra ditt arbete enklare och spara tid och resurser.

Provtagning spelar viktiga roller i datautvinning. Om data är balanserade betyder det att modellen används lika många fall i var och en av grupperna som jämförs (i det exemplet var grupperna egenskaper som ändrade händer och egenskaper som inte gjorde det), även om en grupp hade många fler fall än andra i de ursprungliga uppgifterna.

Senare delades data, delades in i en delmängd som användes för träning av en modell och en annan för testning. Att bara använda ett urval av data i parallella koordinater kan göra det enklare att visa och tolka. (Scatterplots med tusentals poäng kan vara omöjligt svårt att läsa!) Kanske viktigast av allt, samplingen minskar bara mängden data, så sakerna går fortare.

Siktar ut de data du behöver - dummies

Redaktörens val

Nätverksenheter och tjänster Översikt för certifikatprov på CCENT-dummies

Nätverksenheter och tjänster Översikt för certifikatprov på CCENT-dummies

Du kan vara säker på att få några frågor om certifieringsexamen som testar din kunskap om typer av enheter och olika nätverkstjänster. Nedan följer några viktiga punkter att komma ihåg om enheter och tjänster: Nätverksenheter Hubb: Ett nav är en lag 1-enhet som används för att ansluta system tillsammans. När ...

OSI-modell för CCENT-certifieringsexamen - dummies

OSI-modell för CCENT-certifieringsexamen - dummies

Certifieringen certifierar dig kraftigt på OSI-modellen och olika protokoll och enheter som körs på varje lager av OSI-modellen. I följande tabell granskas OSI-modellen genom att ge dig en beskrivning av varje lager och exempel på protokoll och enheter som körs i varje lager. Layer Beskrivning Exempel 7. Applikation ...

OSI-modell för Cisco ICND1-certifieringsexamen - dummies

OSI-modell för Cisco ICND1-certifieringsexamen - dummies

Cisco ICND1-certifieringsexamen testa dig kraftigt på OSI modell och de olika protokoll och enheter som körs i varje lager av OSI-modellen. Följande granskar OSI-modellen genom att ge dig en beskrivning av varje lager och exempel på protokoll och enheter som körs i varje lager. Layer Beskrivning Exempel 7. Applikation ...

Redaktörens val

Hur man skalar på skifferelement i kantfilm - dummies

Hur man skalar på skifferelement i kantfilm - dummies

Skalar ett element i Adobe Edge Animate betyder i huvudsak att du kan ändra storleken på ett element samtidigt som dess proportioner hålls konsekventa om du vill. Du kan: Skalelement med verktyget Transform Skalaelement från Egenskaper-panelen Skalning med verktyget Transform Om du föredrar att använda en klicka-och-dra-metod för skalering ...

Hur man arbetar med mallar i Adobe Edge Animate - dummies

Hur man arbetar med mallar i Adobe Edge Animate - dummies

Mallar introducerades i Edge Animate 2. 0. Denna funktion tar bort nödvändigheten att återuppfinna hjulet varje gång du vill starta en ny komposition. Visst kan du alltid starta en ny komposition från en sparad fil, men Mallar gör att du kan starta ett nytt projekt som redan innehåller attribut och element som du vill ha.

Keyframes Modes in Edge Animation - dummies

Keyframes Modes in Edge Animation - dummies

Keyframe-verktyg i Edge Animate finns till höger om Play-kontrollerna. För att skapa nyckelfiler automatiskt måste du först aktivera nyckelbilder genom att klicka på den röda stoppklockans ikon. Som standard, när du startar en ny animering, är Stopwatch rött men har gråa linjer som löper genom det (som visat). Här är standardstatus för ...

Redaktörens val

Hur man tolkar figurativt språk för GED RLA-dummiesna

Hur man tolkar figurativt språk för GED RLA-dummiesna

Författare använder språk antingen bokstavligt eller figurativt . GED Reasoning Through Language Arts testet kommer att ha några frågor för att testa din förmåga att identifiera skillnaden. En NASA-vetenskapsman kan beskriva en asteroid väldigt bokstavligt: ​​består huvudsakligen av vatten, blandat med vissa stenar och mindre fasta fragment. Eller kan han eller hon skriva figurativt och beskriva ...

Hur (och var) ska schemalägga för att ta GED-dummiesna

Hur (och var) ska schemalägga för att ta GED-dummiesna

För att ta GED test, schemalägger du det baserat på tillgängliga testdatum. Varje stat eller lokalt testcenter ställer in sitt eget schema för GED-testet, vilket innebär att ditt tillstånd bestämmer hur och när du kan ta varje avsnitt av testet. Det bestämmer också hur ofta du kan återta en misslyckad ...

Hur man förbereder sig på GED RLA Extended Response - dummies

Hur man förbereder sig på GED RLA Extended Response - dummies

Uppsats för utvidgad respons på GED Reasoning Through Language Arts-testet kräver några mycket specifika färdigheter, allt från grammatik och korrekt språkanvändning till förståelse och analysförmåga. Om du någonsin har haft ett argument om vem som har det bästa laget eller vilken arbetsgivare är bättre, vet du redan hur man bedömer argument och svarar. ...