Hem

Personliga finanser

YARN Architecture i Hadoop - dummies

YARN Architecture i Hadoop - dummies

YARN, för de som just anländer till den här festen står för ännu en resurs Negotiator, ett verktyg som möjliggör att andra databehandlingsramar körs på Hadoop. YARNs ära är att den presenterar Hadoop med en elegant lösning på ett antal långvariga utmaningar. Garn är avsedd att ge en effektivare och ...

Vad SQL Access Actually Means - dummies

Vad SQL Access Actually Means - dummies

Ett antal företag investerar tungt för att driva öppna källprojekt och egna lösningar för SQL-åtkomst till Hadoop-data. När du hör termen SQL-åtkomst borde du veta att du lita på några grundläggande antaganden: Språkstandarder: Den viktigaste standarden innebär självklart själva språket. Många SQL-liknande lösningar finns, ...

YARNs applikationsmästare i Hadoop - dummies

YARNs applikationsmästare i Hadoop - dummies

Till skillnad från andra YARN-komponenter (ännu en resursförhandlare), ingen komponent i Hadoop 1 kartor direkt till Application Master. I huvudsak är detta arbete som JobTracker gjorde för varje applikation, men genomförandet är radikalt annorlunda. Varje applikation som körs på Hadoop-klyftan har sin egen, dedikerade Application Master-instans, som faktiskt körs i ...

Shuffle-fasen av Hadops MapReduce Application Flow-dummies

Shuffle-fasen av Hadops MapReduce Application Flow-dummies

Efter Map-fasen och före början av Minska fas är en handoff-process, känd som blandning och sortering. Här utarbetas data från mapparuppgifterna och flyttas till noder där reduktionsuppgifterna ska köras. När mapper-uppgiften är klar sorteras resultaten efter nyckel, partitioneras om ...

När känner HBase för dig? - dummies

När känner HBase för dig? - dummies

Så när ska du överväga att använda HBase? Även om svaret på denna fråga inte nödvändigtvis är okomplicerat för alla, för att börja med måste du tydligt ha ett stort datakrav och tillräckliga hårdvara resurser. Ett stort datakrav: Terabytes till petabytes-annars har du många lediga servrar i din rack. Tillräckliga hårdvara resurser: Fem servrar ...

YARNs nodhanterare i Hadoop - dummies

YARNs nodhanterare i Hadoop - dummies

Varje slavnod i Yet Another Resource Negotiator (YARN) har en Node Manager-demon , som fungerar som en slav för resurshanteraren. Som med TaskTracker har varje slavnod en tjänst som binder den till bearbetningstjänsten (Node Manager) och lagringstjänsten (DataNode) som möjliggör för Hadoop att vara ett distribuerat system. ...

YARNs resurshanterare - dummies

YARNs resurshanterare - dummies

Kärnkomponenten i YARN (Yet Another Resource Negotiator) är Resurshanteraren, som styr alla databehandling resurser i Hadoop klustret. Enkelt uttryckt är Resource Manager en dedikerad schemaläggare som tilldelar resurser för att begära applikationer. Dess enda uppgifter är att upprätthålla en global syn på alla resurser i klustret, hantering ...

Tracking JobTracker och TaskTracker i Hadoop 1 - dummies

Tracking JobTracker och TaskTracker i Hadoop 1 - dummies

MapReduce-bearbetning i Hadoop 1 hanteras av JobTracker och TaskTracker demoner. JobTracker upprätthåller en bild av alla tillgängliga bearbetningsresurser i Hadoop-klustret och, när ansökningsförfrågningar kommer in, schemalägger och distribuerar dem till TaskTracker-noderna för utförande. När applikationer körs får JobTracker statusuppdateringar från ...

Höghastighetsdatakachning med NoSQL-dummies

Höghastighetsdatakachning med NoSQL-dummies

Med NoSQL, du har snabb datakachning. Tänk dig att du är en bankräknare med tre andra kollegor som arbetar. Du har var och en en rad människor som ska serveras. En av kunderna fortsätter att hålla sig i linje för att fråga om hans check har blivit inbetalad ännu och beloppet krediterats på sitt konto. När du ...

Hur man kommunicerar insikter från stora data - dummies

Hur man kommunicerar insikter från stora data - dummies

Stora data kan hjälpa dig att få insikt. Företagen får konkurrensfördelar när rätt information levereras till rätt personer vid rätt tidpunkt. Det innebär att utöka insikter och information från data och kommunicera dem till beslutsfattare på ett sätt som de lätt kommer att förstå. Trots allt är människor mindre benägna att agera om de ...

Zookeeper och HBase Reliability - dummies

Zookeeper och HBase Reliability - dummies

Zookeeper är ett distribuerat kluster av servrar som gemensamt tillhandahåller tillförlitliga samordning och synkroniseringstjänster för grupperade applikationer . Visst kan namnet "Zookeeper" först tyckas vara ett udda val, men när du förstår vad det gör för ett HBase-kluster kan du se logiken bakom den. När du bygger och felsöker distribueras ...

Fönstret i HiveQL-dummies

Fönstret i HiveQL-dummies

Konceptet windowing, introducerat i SQL: 2003-standarden, gör det möjligt för SQL-programmeraren att skapa en ram från de data mot vilka aggregat och andra fönsterfunktioner kan fungera. HiveQL stöder nu fönsterrutan per SQL-standarden. Exempel är ganska användbara när man förklarar fönster och aggregatfunktioner. Avgångsfördröjningar kommer med territoriet när de flyger ...

Höghastighetsnyckelåtkomst med NoSQL-dummies

Höghastighetsnyckelåtkomst med NoSQL-dummies

Viktiga värdebutiker i NoSQL handlar om hastighet. Du kan använda olika tekniker för att maximera hastigheten, från cachningsdata, att ha flera kopior av data eller använda de mest lämpliga lagringsstrukturerna. Cache-data i minnet Eftersom data är lättillgängligt när det lagras i RAM-minne, väljer du en nyckelvärdesbutik som ...

Hur man utvecklar en välreglerad och säker stor datamiljö - dummies

Hur man utvecklar en välreglerad och säker stor datamiljö - dummies

En omtänksam och väl reglerade tillvägagångssätt för säkerhet kan lyckas med att mildra mot många säkerhetsrisker. Du behöver utveckla en säker stor datormiljö. En sak du kan göra är att utvärdera ditt nuvarande tillstånd. I en stor datormiljö startar säkerheten med att utvärdera ditt nuvarande tillstånd. Ett bra ställe att börja är ...

Hur man kontrollerar variabel ordning i en dataset - dummies

Hur man kontrollerar variabel ordning i en dataset - dummies

Ordningen för variabler (kolumner) i en dataset brukar bara vara en fråga om hur de ordnades i källfilen eller databasfrågan som användes för att importera dem. Det arrangemanget kanske inte är bekvämt för dig. Om du har många variabler kan det vara svårt att upptäcka dem du vill ha ...

Hur man hämtar data från KNIME - dummies

Hur man hämtar data från KNIME - dummies

Ditt första hands-on-steg med data får det från var som helst är till den plats där du behöver den. Textformat är vanliga, och du kommer sannolikt att stöta på dem ofta. En av de vanligaste är kommaseparerad värde (.csv) text. KNIME. com AG är ett litet mjukvaru- och tjänsteföretag som fokuserar på data ...

Hur man får data från orange - dummies

Hur man får data från orange - dummies

Bioinformatiklaboratoriet vid fakulteten för datavetenskap och informationsvetenskap, University of Ljubljana, Slovenien, utvecklar Orange i samarbete med en öppen källkod. För att öppna provdata i Orange, följ dessa steg:

Hur man hämtar data från RapidMiner - dummies

Hur man hämtar data från RapidMiner - dummies

RapidMiner är ett litet mjukvaru- och tjänsteföretag som fokuserar på data mining. Det erbjuder en data mining produkt med ett visuellt programmeringsgränssnitt. För att öppna provdata i RapidMiner, följ dessa steg:

Hur man får data från Weka-dummies

Hur man får data från Weka-dummies

Universitetet i Waikato-fakultetsmedlemmar utvecklar verktyg som en del av deras arbete mot framsteg av maskininlärningens område. Dessa verktyg används i undervisning, av forskare och inom industrin. Weka är dess allmänt tillgängliga datautvinningsverktyg som erbjuder ett visuellt programmeringsgränssnitt och ett brett utbud av analysfunktioner. MOA är för gruvor i realtid ...

Hanteringspartitioner i NoSQL - dummies

Hanteringspartitioner i NoSQL - dummies

Ordet partition används för två olika begrepp i NoSQL land. En datadisition är en mekanism för att säkerställa att data fördelas jämnt över ett kluster. Å andra sidan sker en nätverkspartition när två delar av samma databaskluster inte kan kommunicera. På mycket stora grupperade system är det allt mer sannolikt att ...

Hur man bygger affärsfodraler - dummies

Hur man bygger affärsfodraler - dummies

Som dataingruvare, du vill ha datautvinningsverktyg, tid att ägna åt ett värdefullt data-gruvprojekt, eller kanske bara möjligheten att göra något nytt och annorlunda än den vanliga rutinen. I din affärssituation ställer du dig inte ut för att få alla att önska data mining. Du bestämmer dig för att övertyga en viss grupp ...

Hur man relaterar en variabel till en annan med scatterplots - dummies

Hur man relaterar en variabel till en annan med scatterplots - dummies

Det första steget mot prediktiv modellering är relaterande variabler till varandra. Ett enkelt, anmärkningsvärt verktyg för det är scatterplot. Det är vanligt att relatera en kontinuerlig åtgärd till en annan. Data miners sträcker sig ibland reglerna och använder det med kategoriska variabler också. Den horisontella (x) axeln i diagrammet representerar värden på en ...

Hur man införlivar stora data i diagnosen sjukdomar - dummies

Hur man införlivar stora data i diagnosen sjukdomar - dummies

ÖVer hela världen, stora data Källor för vården skapas och görs tillgängliga för integration i befintliga processer. Kliniska provdata, genetik och genetiska mutationsdata, proteinterapeutiska data och många andra nya informationskällor kan skördas för att förbättra de dagliga vårdprocesserna. Sociala medier kan och kommer att användas för att förstärka befintliga ...

Hybrid NoSQL Databaser - dummies

Hybrid NoSQL Databaser - dummies

Med tanke på utbudet av datatyper som hanteras av NoSQL databaser, är du förlåt om du tror att du behöver tre olika databaser för att hantera all din data. Men även om varje NoSQL-databas har sin kärnanvändare kan flera användas för att hantera två eller flera datastrukturer. Några ger även sökning ovanpå denna kärna ...

Installerar Python på Linux för att arbeta med algoritmer - dummies

Installerar Python på Linux för att arbeta med algoritmer - dummies

Du använder kommandoraden för att installera Anaconda på Linux - Du får inget grafiskt installationsalternativ. Innan du kan utföra installationen måste du hämta en kopia av Linux-programvaran från Continuum Analytics-webbplatsen. Följande procedur ska fungera bra på något Linux-system, oavsett om du använder 32-bitars eller 64-bitarsversionen ...

Hur man prioriterar stor datakvalitet - dummies

Hur man prioriterar stor datakvalitet - dummies

Att få rätt perspektiv på datakvaliteten kan vara mycket utmanande i världen av stora data. Med de flesta stora datakällor måste du anta att du arbetar med data som inte är rena. Faktum är att den överväldigande överflöd av till synes slumpmässiga och bortkopplade data i strömmar av sociala medier data ...

Installerar Python på MacOS för att arbeta med algoritmer - dummies

Installerar Python på MacOS för att arbeta med algoritmer - dummies

Mac OS X-installationen kommer endast i en form : 64-bitars. Innan du kan utföra installationen måste du hämta en kopia av Mac-programvaran från Continuum Analytics-webbplatsen. Installationsfilerna finns i två former. Den första beror på en grafisk installatör; den andra är beroende av kommandoraden. Kommandoradsversionen ...

Integrera stora data med det traditionella datalagret - dummies

Integrera stora data med det traditionella datalagret - dummies

Medan världarna av stora data och de traditionella data lageret kommer att korsa varandra, det är osannolikt att de slås samman när som helst snart. Tänk på ett datalager som ett system för rekord för företagsintelligens, som en CRM eller ett bokföringssystem. Dessa system är mycket strukturerad och optimerad för specifika ändamål. Dessutom ...

Hur man använder undersökningar till datautgruvor - dummies

Hur man använder undersökningar till datautgruvor - dummies

Undersökningar är användbara för att samla data om nästan vilken aspekt av mänsklig liv. Du kan bara ignorera undersökningar om ditt yrke har inget att göra med människor, som t.ex. astrofysik. Då behöver astrofysiker människor att finansiera sin forskning och vill att folk ska besöka planetarier, så de kanske behöver undersökningar också! Här är exempel på ...

Identitet och åtkomsthantering (IdAM) i NoSQL - dummies

Identitet och åtkomsthantering (IdAM) i NoSQL - dummies

Tillåter en användare att få tillgång till information eller databasfunktionalitet är en sak, men innan du kan göra det måste du vara säker på att systemet "vet" att användaren är vem hon säger att hon är. Det här är där autentisering kommer in. Autentisering kan hända inom en viss databas, eller det kan delegeras till ...

Hur man arbetar med lojalitetsprogramdata - dummies

Hur man arbetar med lojalitetsprogramdata - dummies

Om du har ett lojalitetsprogram och de data som den producerar, vad ska du göra med det? Som databearbetare är det din roll att ge beslutsfattare en analys som stöder verksamheten. Vissa chefer förstår lojalitetsprogram och kan begära specifika uppgifter, kanske mer av det än du har timmar att ...

Undersöka variabler med streckdiagram och histogram - dummies

Undersöka variabler med streckdiagram och histogram - dummies

En grundläggande del av datafondensfasen av data -mineringsprocessen är att undersöka variablerna en i taget, granska deras distributioner och kontrollera efter uppenbara datakvalitetsproblem. Stångdiagram och histogram är visuella sammanfattningar som gör det enkelt och snabbt att förstå variabla fördelningar. De två diagramtyperna är mycket likartade. Om variabeln ...

Håll Big Data Analytics i perspektiv - dummies

Håll Big Data Analytics i perspektiv - dummies

Stora data börjar få en viktig inverkan på affärsstrategin. På grund av den ökande betydelsen av stora data är det bra affärspraxis att hålla dataanalys i perspektiv. Företagen börjar inse att de kan börja använda data under hela planeringscykeln i stället för i slutet. När den stora datamarknaden börjar ...

Viktiga butiker i NoSQL - dummies

Viktiga butiker i NoSQL - dummies

Viktiga butiker NoSQL har en post med ett ID-fält - nyckel i viktiga butiker - och en uppsättning data. Denna data kan vara ett av följande: En godtycklig data som applikationsutvecklaren tolkar (i motsats till databasen) Varje uppsättning namnvärdespar (kallas binärer) Tänk på det ...

Märkning Data - dummies

Märkning Data - dummies

Med koder för data minskar datainmatningstid, förhindrar fel och minskar minneskraven för lagring av data. Men koderna är inte meningsfulla om du inte har dokumentation eller etiketter för att förklara deras mening. Vissa dataformat gör att du kan njuta av fördelarna med att använda koder medan du håller informationen om meningen med ...

Om simning av stora data-strategier - dummies

Om simning av stora data-strategier - dummies

Företag simmar i stora data. Problemet är att de ofta inte vet hur man pragmatiskt använder data för att kunna förutsäga framtiden, genomföra viktiga affärsprocesser eller helt enkelt få ny insikt. Målet med din stora datastrategi och plan ska vara att hitta ett pragmatiskt sätt att utnyttja data ...

Hantera omfattningen av ett data-miningprojekt - dummies

Hantera omfattningen av ett data-miningprojekt - dummies

Det är inte bara dina egna intressen som kan orsaka att ett projekt kan expandera. När du jobbar har du diskussioner med medarbetare, och de kommer alla att ha idéer och frågor för att inspirera mer prospektering. Att ställa frågor och utforska data kan vara kul. Nu när du är data miniräknare kommer du att upptäcka att du kan fråga och ...

Lokalisering av den algoritm du behöver - dummies

Lokalisering av den algoritm du behöver - dummies

Följande tabell beskriver algoritmer och algoritmtyper som du kan hitta användbara för olika typer av dataanalys. (Du kan hitta diskussioner om alla dessa algoritmer i Algoritmer för Dummies.) Algoritm Beskrivning Användbar länk A * Sök Algoritmen spår kostnaden för noder när den utforskar dem med ekvationen: f (n) = g (n) ...

Redaktörens val

Hur man lägger till text i en sätter () Funktion i C Programmering

Hur man lägger till text i en sätter () Funktion i C Programmering

När du behöver visa en annan textrad, använd C-programmeringsfärdigheterna för att skapa en annan puts () -funktion i källkoden, som visas i Visa två textlinjer. VISA TILL TEXTFINER # inkludera int main () {sätter ("Hickory, Dickory, Dock,"); sätter ("musen sprang klockan."); returnera (0);} Den andra ...

Förklarar variabler i C-dummies

Förklarar variabler i C-dummies

Variabler är det som gör dina program zooma. Programmering kan bara inte bli gjort utan dem. Så om du inte har introducerats till variabler än, här går du. Valerie Variable är en numerisk variabel. Hon älskar att hålla nummer - vilket nummer som helst; det spelar ingen roll. När hon ser ett lika tecken tar hon ett värde och ...

Redaktörens val

Gör rädsla för din vän - dummies

Gör rädsla för din vän - dummies

Rädsla är lika verklig som mod. Även om värdet av rädsla inte är lika uppenbart som modets värde, har det dess fördelar. Rädsla är din instinkt som säger att du är obehaglig - även om situationen inte kommer att skada dig. Alla har haft den känslan när man hellre drar locket ...

Hur man ökar din självmedvetenhet - dummies

Hur man ökar din självmedvetenhet - dummies

Du kommer att vara med dig själv under en livstid. Ingenting kommer att förändra det faktum. Att lära känna, som att lyssna på och uppskatta själv är avgörande för din sanity. Kanske kommer du till att älska, acceptera och omfamna alla du är, är svår för dig att föreställa dig just nu, men du kan göra ...

Hur man ökar din mentala flexibilitet - dummies

Hur man ökar din mentala flexibilitet - dummies

ÄR flexibel i arbete och relationer är ett tecken på en högpresterande. Medan perfektionister är styva och obehagliga i sitt arbete och hur de interagerar med andra, är högpresterande mer öppna och tillmötesgående. Att vara mer flexibel på jobbet gav Ralph aldrig förslag under brainstorming vid gruppmöten. Han kände att hans lag ...

Redaktörens val

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Linux är i sig ett kommandoradsorienterat operativsystem. Grafiska användargränssnitt - inklusive installationsprogrammets GUI - tillhandahålls av en valfri komponent som heter X Window System. Men medan du arbetar med det grafiska användargränssnittet för installationsprogrammet, håller Linux flera ytterligare kommandorads-konsoler öppna. Normalt behöver du inte ...

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Alla användare som åtkomst ett Linux-system, lokalt eller över ett nätverk, måste verifieras av ett giltigt användarkonto på systemet. I det följande får du veta hur du loggar in och ut på ett Linux-system och hur du stänger av systemet. Logga in När Linux startar upp visas det ...

Nätverksadministration: Licensserver - Dummies

Nätverksadministration: Licensserver - Dummies

I vissa program kan du köpa nätverkslicenser som gör att du kan installera programvaran på många datorer som du vill, men reglera antalet personer som kan använda programvaran vid en viss tidpunkt. För att styra hur många som använder programvaran, är en särskild licensserver inrättad. När en användare börjar ...