Träffa den ursprungliga datamineraren: Tom Khabaza - dummies
Hur kom Tom Khabaza för att lägga ner lagarna av data mining? Det finns något att säga för att vara först på scenen. Khabaza startade data mining i början av 1990-talet, då få personer hade ens hört talas om datavinnning, än mindre försökt det. Han började sin karriär i psykologi och gravitated till ...
Sammanfoga och lägga till data - dummies
När dina data finns på mer än ett ställe, behöver du sätt att sammanfatta det . När du går med i två dataset med olika variabler sammanfogar du data. Sammanslagning är en gemensam operation. Sammanslagning används ofta i datautvinning, som kombinerar länkade data, såsom kundrekord och marknadsföringskampanjdata före och efter testen ...
Hanterar Tillgänglighet i NoSQL - dummies
Som med andra NoSQL-databastyper, med viktiga värdebutiker kan du handla lite konsistens för viss tillgänglighet. Key-value-butiker tillhandahåller vanligtvis ett brett spektrum av konsistens- och hållbarhetsmodeller - det vill säga mellan tillgänglighet och partitionstolerans och mellan konsekvent och partitionstolerans. Några viktiga värdebutiker går mycket längre på konsistensarmen och överger BASE ...
Nya dimensioner för Big Data Planning Cycle - dummies
Med tillkomsten av stora data, vissa ändringar kan påverkar hur du närmar dig affärsplanering. Eftersom fler företag börjar använda molnet som ett sätt att distribuera nya och innovativa tjänster till kunder, exploderar dataanalysens roll. Du kanske vill tänka på en annan del av din planeringsprocess. Efter ...
Hantera olika datatyper med NoSQL-dummies
NoSQL-databaser är inte begränsade till en rad-och-kolumn . De är utformade för att hantera en stor mängd data, inklusive data vars struktur förändras över tiden och vars relationer ännu inte är kända. NoSQL databaser finns i fyra kärntyper - en för varje typ av data som databasen förväntas hantera: Columnar: Utvidgning till traditionell ...
Matchande data för algoritmer från olika källor - dummies
Interagerar med data från en enda källa är ett problem; Att interagera med data från flera källor är helt annat. Däremot kommer dataset i dag generellt från mer än en källa, så du behöver förstå de komplikationer som med hjälp av flera datakällor kan orsaka. När du arbetar med flera datakällor måste du göra följande: Bestäm ...
Hantera nycklar i NoSQL - dummies
Nyckelvärdesaffärernas snabbläsningsfunktioner härrör från användningen av väldefinierade nycklar. Dessa nycklar är vanligtvis hashed, vilket ger en nyckelvärdesbutik ett mycket förutsägbart sätt att bestämma vilken delning (och därmed server) data finns på. En viss server hanterar en eller flera partitioner. En bra nyckel gör det möjligt att unikt identifiera den enskilda posten ...
Hantera data i NoSQL - dummies
När du hanterar nycklarna på rätt sätt är du redo att utforma hur du lagrar data med NoSQL och se till att det är säkert och alltid tillgängligt för det arbete du behöver göra. Datatyper i viktiga värdebutiker Viktiga butiker fungerar som & ldquo; hinkar & rdquo; för binär data. Vissa databaser ger stark intern datatyckning och till och med ...
Apache Zookeeper och NoSQL Databaser - dummies
Ett stort antal NoSQL-databaser är en otrevlig sak att hantera. Apache Zookeeper till räddningen! Att hålla reda på vilka noder som finns i klustret, vilka data som hanteras och se till att nya mästare väljs när en mästare misslyckas är inte enkla uppgifter. Koordinering av stora distribuerade system är därför mycket svårt. Båda Hadoop ...
Hanterar användarinformation med NoSQL - dummies
Det finns uppgiftskritiska data och det finns stödjande data. Det är okej om din missionskritiska data visas lite långsamt eftersom du vill vara säker på att det är säkert och korrekt hanterat. Men du vill inte att de stödjande uppgifterna i din ansökan hindrar övergripande transaktioner och användarupplevelser. Även om stödjande data kan vara lägre i värde, är det ...
Dokument NoSQL versus ECM-dummies
System för företagsinnehållshantering (ECM) har funnits i mer än tio år. Dokument NoSQL kan erbjuda lite konkurrens. Exempel på ECM: s är IBM FileNet, DB2 Content Manager och EMC Documentum. Många mindre företag, som Stellent (nu Oracle), har införlivats i större erbjudanden. Ett förenklat ECM-system, kallat grundläggande innehållstjänster, uppträdde också ...
Trippel och grafbutiker - dummies
Trippelbutiker verkar bryta mot konventionerna associerade med NoSQL. För en sak är de alla ACID-kompatibla. Till skillnad från de flesta aktuella NoSQL-databaser är många tredubbla butiker bara proprietära. Också finns öppna standarder för semantiska applikationer på ett sätt som inte är fallet för nyckelvärdesbutiker, Bigtable / wide kolumn butiker och dokument NoSQL databaser. Helt beroende av ...
Andra Hybrid NoSQL Databaser - dummies
Det finns några NoSQL databaser som du sannolikt kommer att höra nämnde ofta - OrientDB och MarkLogic och kanske, ArangoDB. Det finns emellertid andra hybrid NoSQL-databaser av intresse. FoundationDB FoundationDB är en ACID-kompatibel nyckelvärdesbutik med öppen källkod. Vad som är unikt med FoundationDB är att det är utformat så att utvecklare effektivt kan ansluta sina egna data ...
NoSQL-sökfunktioner att överväga - dummies
Många NoSQL-databaser stöder sökfunktioner och vissa sökfunktioner. Att välja den rätta kommer ofta till att förstå de funktioner du behöver stödja. Trots att de är relaterade är frågan och sökningen helt annorlunda. En fråga returnerar bara resultaten som matchar alla villkor i den. Sök kan däremot inkludera frivilliga ...
Mikrotargeting till Win Elections - dummies
De flesta politiska kampanjer är beroende av konsulter för att ge vetenskaplig forskning, annars kommer man med mycket informella bedömningar av väljareens inställning och intresse för att rösta för en viss kandidat (eller rösta alls). Men de senaste åren har vissa politiska kampanjer, inklusive både kandidat- och problemkampanjer, börjat använda mikrotargeting, organiserade undersökningsprogram ...
NoSQL och sökmotorer - dummies
Det kan tyckas konstigt att nämna sökmotorer och NoSQL tillsammans, men många av dagens sökmotorer använd en arkitektur som mycket liknar NoSQL databaser. Deras index och förfrågningsbehandling är mycket fördelade. Många sökmotorer är till och med kapabla att fungera som ett nyckelvärde eller en dokumentaffär i sig. NoSQL-databaser är ofta ...
Data mining - dummies
Data mining har mycket strikta krav för dataanalysering. De är inte exotiska, komplexa eller svåra krav att mötas, men de är strikta. Figuren visar ett urval data som ses som en tabell i datautvinningsprogram. Varje rad representerar ett paket av fastigheter. Information om fastighetspaket är organiserad i ...
10 Killer NoSQL Applications - dummies
Ofta köper människor en särskild plattform på grund av de mördareapps som körs på den. Många NoSQL-baserade program faller i kategorin Killer App. Dessa applikationer kunde inte ha blivit en verklighet med hjälp av befintlig databassteknik. Facebook Messaging Platform Apache Cassandra skapades av Facebook för att driva sin inkorg. Det gjorde detta för en ...
Inte så vanliga funktioner hos NoSQL-dummies
ÄVen om vissa funktioner är ganska vanliga för NoSQL-databaser ( till exempel schema agnosticism och icke-relationell struktur) är det inte ovanligt att en databas saknar en eller flera av följande funktioner och fortfarande kvalificerar som en modern NoSQL-databas. OpenSource NoSQL-programvara är unik eftersom öppen källkodsrörelse har drivit utveckling snarare än att följa en ...
Prestanda och Big Data-dummies
Bara med en snabbare dator räcker inte för att säkerställa rätt prestanda att hantera stora data. Du måste kunna distribuera komponenter i din stora datatjänst över en rad noder. I distribuerad databehandling är en nod ett element som ingår i ett systemkluster eller inom ett rack. En ...
ÖVervinna stora datafärdigheter brister - dummies
Stora datakunskaper är bristfälliga. Eftersom mängden digital information som genererats av företag har ökat exponentiellt, har en utmaning (vissa människor kallat det en kris) uppstått: det finns bara inte tillräckligt med personer med nödvändiga färdigheter för att analysera och tolka alla dessa stora data. I en ny undersökning är mer än hälften av ...
Fas 5 i CRISP-DM-processmodellen: utvärdering - dummies
Under de första fyra faser i processmodellen Cross Process Industry Process Processing (CRISP-DM), du har undersökt data och du har hittat mönster, och nu måste du fråga: Är resultaten något bra? Du kommer att utvärdera inte bara de modeller du skapar utan också den process som du brukade skapa dem och deras potential ...
NoSQL Villkor och definitioner - dummies
Får huvudet runt NoSQL kan vara lite svårt. Om du studerat databaser i skolan kan du ha blivit indoktrinerad i ett relationellt sätt att tänka på. Säg databas till de flesta människor, och de tror att relationsdatabashanteringssystemet. Detta är naturligt eftersom RDBMS under de senaste 30 åren har varit så dominerande. Till ...
NoSQL For Dummies Cheat Sheet - dummies
Som en NoSQL-utvecklare, väljer du rätt produktkategori och rätt produkt är första steget. Dessa guider jämför de viktigaste funktionerna i några av de mest populära NoSQL-databaserna.
Metoder för att säkerställa stor datastyrning - dummies
Med de styrande utmaningar som presenteras av stora data, det är klokt och absolut nödvändigt att ha rutiner på plats för att säkerställa att du skyddar din information. Medan graden som du gör kommer dessa att variera beroende på ditt företag, se till att du tar nödvändiga försiktighetsåtgärder. Granska din stora dataprocess Vid ...
Sätter in byggnadsinformationsmodelleringsunderlag i stället - dummies
Du vill få ditt företag att slåss och passa BIM, men att få grunden rätt är allt i förberedelserna. BIM tillåter dig att skapa nya processer och arbetsflöden och samarbeta på dina projekt. BIM är användbar över hela projektets tidslinje från konceptstadiet, byggandet och sedan över ...
Sätta dina stora data tillsammans - dummies
Hur kommer du veta hur man sätter samman alla dina data? Med ett stort dataprojekt anger vad du vill göra med din strukturerade och ostrukturerad data varför du kan välja en del av tekniken över en annan. Det bestämmer också behovet av att förstå inkommande datastrukturer för att sätta denna data i ...
Fas 6 i CRISP-DM-processmodellen: Deployment - dummies
Gruvdrift lönar sig. I den här sista fasen av processen CRISP-DM (Cross Industry Industry Process Processing for Data Mining), spelar det ingen roll hur briljanta dina upptäckter kan vara eller hur perfekt dina modeller passar data om du inte använder dem faktiskt saker att förbättra sättet att göra affärer. Utbyggnaden ...
Fas 3 i CRISP-DM Process Model: Data Preparation - dummies
Data miners spendera merparten av sin tid på den tredje fasen av processprocessen för cross-industry standardprocess för data mining (CRISP-DM): databehandling. De flesta data som användes för data mining samlades ursprungligen och bevarades för andra ändamål och behöver viss förfining innan den är redo att användas för modellering. Databehandlingsfasen innehåller ...
Fas 4 av CRISP-DM Processmodellen: Modellering - dummies
Modellering är delen av processprocessen för korsindustrin Standard Process for Data Mining (CRISP-DM) som de flesta datavinnare gillar bäst. Dina data är redan i god form, och nu kan du söka efter användbara mönster i dina data. Modelleringsfasen innehåller fyra uppgifter. Dessa är att välja modelleringstekniker. Utforma test Byggmodell (er) Bedömning ...
Sätta företagen rätt till stora organisationsstrukturer - dummies
Data genom att börja med ett organisatoriskt experiment för att se om stora data kan spela en viktig roll för att definiera och påverka affärsstrategi. Men när det blir klart att stora data kommer att ha en strategisk roll som en del av informationshanteringsmiljön, måste du se till att ...
Fas 2 i CRISP-DM-processmodellen: Dataförståelse - dummies
I andra fasen av processmodellen Cross Process Industry Standard Process for Data Mining (CRISP-DM), får du data och verifierar att det passar dina behov. Du kan identifiera problem som gör att du återvänder till affärsförståelse och reviderar din plan. Du kan till och med upptäcka brister i din företagsförståelse, en annan anledning till att ...
Reducerar tid till värde i NoSQL-dummies
Tiden för värde är den tid som krävs från att starta ett IT-projekt att kunna uppnå affärsförmåner. Det kan vara konkreta fördelar med kostnadsminskning eller förmågan att handla om nya affärer eller immateriella fördelar som att tillhandahålla bättre kundservice eller produkter. Key-value-butiker är de enklaste NoSQL-databaser med hänsyn till ...
För att undersöka egna data - dummies
Nu när du är data miniräknare är du också en primärforskare. Låter mer vetenskapligt, eller hur? Din forskning är primär eftersom du kommer att börja från råa (grundläggande, obehandlade) data och analysera den för att lägga till något nytt för världens kunskaper. Du kommer förmodligen också att integrera viss sekundärforskning i ditt arbete. Med andra ord kommer du att ...
Rollbaserad åtkomstkontroll i NoSQL-dummies
En av de vanligaste metoderna för att säkra data i NoSQL är att tilldela varje post (eller dokument eller diagram, beroende på din databas typ) med en uppsättning behörigheter kopplade till roller. Detta är rollbaserad åtkomstkontroll, eller RBAC för kort. Tänk på ett pressmeddelande för en webbplats som lagras i en ...
Skalning NoSQL - dummies
Ett vanligt kännetecken för NoSQL-system är deras förmåga att skala över många råvararservrar. Dessa relativt billiga plattformar innebär att du kan skala upp databaser genom att lägga till en ny server istället för att ersätta gammal hårdvara med ny, kraftfullare hårdvara i ett enda skott. Det finns högvolymanvändningsfall som snabbt kommer att tvinga dig ...
Kalkylblad, XML och specialdataformat - dummies
Du kan behöva använda data som finns i ett kalkylblad , XML (extensible markup language), eller några av dussintals mindre vanliga format. Nyckelfrågan kommer alltid att vara: Har din data-mining ansökan importera data i det formatet? Så länge som din data-mining ansökan har ett verktyg för att läsa det dataformat du behöver, processen ...
Ställa in rätt Foundation for Big Data - dummies
Så hur börjar du med din resa för att skapa rätt miljö så att du är redo att både experimentera med stora data och vara beredd att utöka din användning av stora data när du är redo? Ska du investera i ny teknik för ditt datacenter? Kan du utnyttja molnet ...
ÖVerväganden med Big Data - dummies
Medan företag är mycket oroade över säkerheten och styrningen av deras data i allmänhet, stora datainitiativ kommer med vissa komplexiteter och oförutsedda problem som många företag inte är beredda att hantera. Ofta utförs stor dataanalys med en mängd olika datakällor som kan komma från många obehandlade källor. Dessutom ...