Hem Personliga finanser Faktorer som ökar skalaen för statistisk analys i Hadoop - dummies

Faktorer som ökar skalaen för statistisk analys i Hadoop - dummies

Video: Träna för din hjärna - en föreläsning med Anders Hansen 2025

Video: Träna för din hjärna - en föreläsning med Anders Hansen 2025
Anonim

Anledningen människor prövar deras data innan de kör statistisk analys i Hadoop är att denna typ av analys ofta kräver betydande datorresurser. Det handlar inte bara om datamängder: det finns fem huvudfaktorer som påverkar omfattningen av statistisk analys:

  • Det här är enkelt, men vi måste nämna det: volymen av data som du utför analysen bestämmer definitivt analysens omfattning.

  • Antalet transformationer som behövs för datasättningen innan man tillämpar statistiska modeller är definitivt en faktor.

  • Antalet parvisa korrelationer du behöver beräkna spelar en roll.

  • Graden av komplexitet hos de statistiska beräkningar som ska tillämpas är en faktor.

  • Antalet statistiska modeller som ska tillämpas på din dataset spelar en viktig roll.

Hadoop erbjuder ett sätt ut ur detta dilemma genom att tillhandahålla en plattform för att utföra massivt parallella bearbetningsberäkningar på data i Hadoop.

På så sätt kan den vända det analytiska dataflödet; istället för att flytta data från sitt repository till analysservern, levererade Hadoop analys direkt till data. Mer specifikt tillåter HDFS att lagra dina bergs data och sedan ta beräkningen (i form av MapReduce-uppgifter) till slavnoderna.

Den gemensamma utmaningen som uppstår genom att flytta från traditionella symmetriska multibearbetningsstatistiksystem (SMP) till Hadoop-arkitekturen är dataläget. På traditionella SMP-plattformar delar flera processorer åtkomst till en enda huvudminnesresurs.

I Hadoop kopierar HDFS partitioner av data över flera noder och maskiner. Även statistiska algoritmer som utformades för att bearbeta data i minnet måste nu anpassa sig till dataset som spänner över flera noder / rack och kunde inte hoppas att passa i ett enda minnesblock.

Faktorer som ökar skalaen för statistisk analys i Hadoop - dummies

Redaktörens val

En samling av bilder från att förbättra din golfsvingning i A Dag för Dummies - Dummies

En samling av bilder från att förbättra din golfsvingning i A Dag för Dummies - Dummies

Siffrorna i det här galleriet är från Förbättra din Golf Swing In A Day For Dummies och illustrera olika komponenter i golf swing. Bilderna visas i den ordning de visas i boken.

Golf Etiquette Basics - dummies

Golf Etiquette Basics - dummies

Gripa alla relevanta golfspel tar inte tid. Så du är bekväm på alla golfbanor och med vilken spelare som helst, använd denna lista som en bra start för golfetikettens regler. Gör: Spela i rimlig takt. Reparera kulmärken, byt ut divots och rake bunkrar. Var uppmärksam på reglerna som ...

Golf för Dummies Cheat Sheet (UK Edition) - dummies

Golf för Dummies Cheat Sheet (UK Edition) - dummies

ÄR din sväng upp till skrap? Är din satsning mindre än perfekt? Detta fuskblad förklarar hur du förbättrar din teknik och ditt tänkande om ditt golfspel.

Redaktörens val

Få hjälp med Dragon Professional Individual - dummies

Få hjälp med Dragon Professional Individual - dummies

Om du behöver hjälp, är du aldrig långt borta i Dragon Professional Individual med DragonBar öppet. Här är några av de sätt som du kan hitta hjälp direkt från DragonBar på skrivbordet: Hjälpmeny: Om du vill nå hjälpfiler från DragonBar, gå till Hjälp → Hjälpämnen och skriv eller säg vad du är ...

Format Text i NaturallySpeaking - dummies

Format Text i NaturallySpeaking - dummies

Formatmenyn är där alla formateringsfiler hänger: typsnitt, indragningar, kulor och flikar. Liksom Redigera-menyn är menyn Format enkelt om du tidigare har använt en ordbehandlare. Här är menyalternativen som ändrar formatet: Teckensnitt: Välj Format → Teckensnitt för att få en dialogruta för teckensnitt för att göra din ...

Börja i Word med Dragon NaturallySpeaking - dummies

Börja i Word med Dragon NaturallySpeaking - dummies

Om du har använt NaturallySpeaking för även en kort tid , du vet att det finns många olika sätt att uppnå samma sak. Ta en titt på alla sätt du kan arbeta i Word eller WordPerfect för en enkel, okomplicerad upplevelse. Vid tidpunkten för det här skrivandet, Word 2003, Word 2007, Word ...

Redaktörens val

Hur man bestämmer takt för marknadsautomatisering Nurture Emails - dummies

Hur man bestämmer takt för marknadsautomatisering Nurture Emails - dummies

En marknadsautomatisering vårdkampanj hjälper dig att effektivt hantera ett förhållande under en lång tid med mycket liten ansträngning. Här är de grundläggande reglerna för stimulering, liksom vissa specifika taktik att använda i någon vårdkampanj för att göra dem mer effektiva. Följ de allmänna taktreglerna. Den ...

Hur man etablerar uppföljning av e-postmarknadsföringens automationsmallar - dummies

Hur man etablerar uppföljning av e-postmarknadsföringens automationsmallar - dummies

Kom ihåg att en vårdkampanj fungerar som ett ett till ett medium, medan e-sprängning är ett till många medium. För att öka engagemanget måste du börja med förståelsen av kampanjen One-to-One Om du har gjort e-postmarknadsföring ett tag och du har några ...

Hur man skapar automatiserat marknadsföringsinnehåll för blyhantering - dummies

Hur man skapar automatiserat marknadsföringsinnehåll för blyhantering - dummies

Nummer ett klagomål från människor att få började med marknadsautomatisering är att de inte har tillräckligt med tid för att skapa innehåll. Detta är också den främsta orsaken till att företagen försenar sitt antagande av marknadsautomatisering. Men den verkliga frågan är att de tänker på innehåll på fel sätt. När du bygger innehåll för ...