Lager 2 av Big Data Stack: Operations Databaser - dummies
I kärnan till alla stora datormiljö och lag 2 i den stora datapacken är databasmotorerna som innehåller samlingar av dataelement som är relevanta för ditt företag. Dessa motorer måste vara snabba, skalbara och steniga fasta. De är inte alla skapade lika, och vissa stora datamiljöer kommer att bli bättre med ...
Skikt 3 i Big Data Stack: Organisera datatjänster och verktyg - Dummies
Organisera datatjänster och verktyg, lager 3 av den stora databacken, fånga, validera och montera olika stora dataelement i kontextrelevanta samlingar. Eftersom stora data är enorma har tekniker utvecklats för att bearbeta data effektivt och sömlöst. MapReduce är en kraftigt använd teknik. Det är tillräckligt att säga här att många av dessa organiserar ...
Nyckelparametrar i en stor datamiljö - dummies
Den enklaste Databaserna NoSQL (inte bara SQL) i en stor datormiljö är de som använder KVP-modellen (Key Value Par). KVP-databaser kräver inte ett schema (som RDBMS) och ger stor flexibilitet och skalbarhet. KVP-databaser erbjuder inte ACID-förmåga (Atomicity, Consistency, Isolation, Durability) och kräver att implementatörer tänker på data ...
Träffas med datalagringsrepresentanter - dummies
Handla för datalagringsprodukter kan omfatta möten med företagsrepresentanter. Innan en försäljningsrepresentant sätter in foten på ditt kontor eller initierar en webbkonferens med dig, gör helt klart vad du förväntar dig att täcka under det första eller två timmars första mötet. Du bör göra åtminstone följande: Hör en presentation av ...
Lager 1 av säkerhetsdatabasen - dummies
Säkerhets- och integritetsbehov 1 av den stora databacken, liknar kraven för konventionella datamiljöer. Säkerhetskraven måste anpassas nära specifika affärsbehov. Några unika utmaningar uppstår när stora data blir en del av strategin: Datatillgänglighet: Användaråtkomst till råa eller beräknade stora data har ...
Skikt 4 i Big Data Stack: Analytiska Data Warehouses - Dummies
Datalagret, skikt 4 i den stora databacken och dess följeslagare data mart har länge varit de primära tekniker som organisationer använder för att optimera data för att hjälpa beslutsfattare. Typiskt innehåller datalager och mars normaliserade data som samlats in från en mängd olika källor och monteras för att underlätta analysen av verksamheten. Data ...
Hantera virtualisering för stora data - dummies
Virtualisering skiljer resurser och tjänster från den underliggande fysiska leveransmiljön, så att du kan skapa många virtuella system inom ett enda fysiskt system. En av de främsta orsakerna till att företagen har implementerat virtualisering är att förbättra prestanda och effektivitet vid bearbetning av en mångsidig blandning av arbetsbelastningar. Den stora datahypervisorn I ett idealiskt ...
Middleware för datalagring - dummies
Middleware är dataprogramvara som ansluter programkomponenter. I en datalagringsmiljö är middleware-tjänsterna den uppsättning program och rutiner som gör följande: Dra data från källan (eller källorna). Se till att data är korrekta. Flytta data runt miljön från plattform till plattform, efter behov. Hantera alla nödvändiga ...
Masterdata management (MDM) - dummies
De senaste åren har ODS-stil återkopplingssystem definierats för ett visst ändamål - referensdata - har uppstått Alla system är fyllda med referensdata. Dessa data kan innehålla den uppsättning data du använder för att beskriva scenen för en försäljningsmöjlighet (till exempel en ledning, en kvalificerad ledare, en möjlighet, ett prognostiserat tillfälle och ...
Middleware Tjänster: Data Mapping and Transformation - dummies
Den här bilden visar en miljö där data extraheras från tre olika datakällor för inkludering i ett datalager, och var och en av de tre källorna ligger på en annan plattform. Vid något tillfälle i middleware-processen måste dessa QA'd-extrakt sammanföras för en kombinerad kartläggnings- och transformationsprocess. Den ...
Middleware Tjänster: Data rörelse och data laddning - dummies <[SET:descriptionsv]I de flesta situationer, de två middleware-tjänsterna - val av
I de flesta situationer, de två middleware-tjänsterna - val av
Middleware Tjänster: Data Selection and Extractions - dummies
Det primära syftet med dataselektion och -xtraktionstjänsten är att välja från (hitta i) en datakälla de data som du vill flytta till datalageret och sedan extrahera (dra ut) den data till en blankett som kan läsas för kvalitetssäkringstjänster. Du kan använda en av två olika typer ...
Mina Big Data med Hive-dummies
Hive är ett batchinriktat datalagringslager byggt på kärnelementen av Hadoop (HDFS och MapReduce) och är mycket användbar i stora data. Det ger användare som känner till SQL med en enkel SQL-lite-implementering som heter HiveQL utan att offra åtkomst via mappers och reduktionsapparater. Med Hive kan du få det bästa av båda världarna: SQL-liknande åtkomst ...
Multidimensionella databaser - dummies
Det här är inte första gången i den senaste historiken att nya typer av databasprodukter har uppstått och övervinna RDBMS ineffektivitet . Tillbaka på 1980-talet identifierades en klass av applikationer där RDBMS-produkter misshandlade datahanteringsbehoven (särskilt genereringen av RDBMSs tillgängliga på den tiden). Dessa applikationer alla behövde användardefinierade datatyper som ...
Middleware Tjänster: Data Quality Assurance - dummies
Du bör skapa två olika kvalitetssäkringstjänster i flödet av middleware-tjänster. Du måste utföra de första QA-uppgifterna mot extraktet från datakällan innan du utför mer middleware-tjänster. Datakvalitetssäkring: del I Försök att fånga (och korrigera) fel och problem så tidigt i processen ...
Icke-relationella databaser i en stor datamiljö - dummies
Icke-relationella databaser bygger inte på tabellen / nyckelmodellen endemisk till RDBMSs (relationsdatabashanteringssystem). Kort sagt kräver specialdata i den stora datavärlden specialitetstest och data manipuleringsteknik. Även om dessa nya databasstorlekar erbjuder några svar på dina stora datautmaningar, är de inte en uttrycklig biljett till målet ...
Sätta stora data att använda - dummies
Textanalys kan användas för att få insikt i data. Så, vad händer om data är stora data? Det skulle innebära att de ostrukturerade data som analyseras är hög volym, hög hastighet eller båda. Stora data och kundens röst Optimera kundupplevelse och förbättra kundretention är dominerande drivrutiner för ...
Nio tecken på ett framgångsrikt datalagringsprojekt - dummies
Bara för att alla samlar i företagets cafeteria för kaka och plaster väggarna med gratulationsbannor betyder inte att ditt datalagringsprojekt var en framgång. Detta kapitel ger dig några sätt att berätta att du var riktigt framgångsrik. Verkställande sponsorn säger, "Den här saken fungerar - det fungerar verkligen! "Anta att en äldre ...
Modifiera Business Intelligence-produkter för hantering av stora data - dummies
Traditionella affärsinformationsprodukter var inte riktigt utformade för att hantera stora data, så de kan behöva vissa modifieringar. De var utformade för att fungera med mycket strukturerad, väl förstådd data, som ofta lagras i ett relationsdatabibliotek och visas på skrivbordet eller datorn. Den här traditionella affärsintelligensanalysen används vanligtvis på snapshots av data snarare ...
Andra typer av Business Intelligence - dummies
Tyvärr, den snygga, organiserade modellen som har fyra olika typer av business intelligence kategorier (frågande och rapportering, företagsanalys [OLAP], datautvinning och instrumentpaneler och scorecards) kan utvidgas för mer komplexa applikationer. Ett OLAP- eller instrumentbrädans verktyg kan till exempel ha GIS-funktioner (eller det kanske inte är det). Såsom visas i ...
Förbereda sig för Semantics in Data Warehousing - dummies
Om du utvärderar hur tekniken för datalagring fungerar mycket av metadata hanteras på ett proprietärt sätt inom verktyget. Vissa har tidigare försökt lösa integrationsproblemet genom att skapa ytterligare en teknik, känd som tekniska metadataförvar, för att integrera alla dessa metadata från de olika verktygen. Sådana ...
Ska du använda verktyg eller anpassad kod? - dummies
I de tidiga dagarna av datalagring hanterade de flesta organisationer middleware-tjänster genom anpassad kodning, snarare än med de få verktyg som är tillgängliga vid det tillfället, som visas i det här exemplet: En organisation skriver ett program i en programmering språk som COBOL, eller kanske i en miljö som SAS, för att hantera dataextrakten ...
Frågor och rapporteringsverktyg för datalagring - dummies
Ett fråge- och rapporteringsverktyg hjälper dig att köra vanliga rapporter, skapa organiserade listor, och utför rapportering och frågning på tvärsegment. Här är några frågor och rapporteringsverktyg för att bekanta dig med. SQL SQL-rollens roll är det officiella databasfrågesspråket som används för att få tillgång till och uppdatera data som ingår i ett relationsdatabashanteringssystem, ...
Replikering Tjänster för datalagring - dummies
Replikering middleware-tjänster kombinerar val och extraktion, rörelse och laddning från en databas till en eller flera andra, som vanligtvis hanteras av en enda DBMS-produkt. (Källdatabasen och alla mål är alla Oracle, all Sybase eller all Microsoft SQL Server, till exempel.) Även om replikeringstjänsterna varierar mellan DBMS-produkter, har de traditionellt ...
RDBMSs i en Big Data Environment - dummies
Stora data blir ett viktigt element i hur organisationerna utnyttjar höga -volymen i rätt hastighet för att lösa specifika dataproblem. Relationella databashanteringssystem är viktiga för denna höga volym. Stora data lever inte isolerat. För att vara effektiva måste företagen ofta kombinera resultaten av ...
Sex leverantörer med middleware-produkter för datalagring - dummies
Det finns flera leverantörer som erbjuder datalagring av middleware-produkter du kanske vill titta på. Här är sju som är värda att överväga. Composite Software Composite Software tillhandahåller produkter och teknik för Enterprise Information Integration (EII). Genom att använda Composite kan du komma åt och kombinera data från olika datakällor, inklusive paketerade applikationer som ...
Strukturerad data i en stor datamiljö - dummies
Termen strukturerad data refererar generellt till data som har en definierad längd och format för stora data. Exempel på strukturerad data inkluderar siffror, datum och grupper av ord och nummer som kallas strängar. De flesta experter är överens om att denna typ av data står för cirka 20 procent av de data som finns där ute. Strukturerad data ...
Rumsliga databaser i en stor datamiljö - dummies
Rumsliga databaser kan vara ett viktigt verktyg i ditt stora dataprojekt . Spatialdata i sig standardiseras genom Open Geospatial Consortium (OGC), som inrättar OpenGIS (Geographic Information System) och ett antal andra standarder för rumslig data. Oavsett om du vet det eller inte, kan du interagera med rumsliga data varje dag. ...
Cloud i kontexten Big Data - dummies
Cloud computing är ett sätt att tillhandahålla en uppsättning av delade datorresurser och blir allt viktigare för ditt stora datainitiativ. Molnet innehåller applikationer, datorer, lagrings-, nätverks-, utvecklings- och installationsplattformar, samt affärsprocesser. Cloud computing gör traditionella siled computing-tillgångar till delade pooler av resurser baserade på en underliggande ...
Tio obligatoriska färdigheter för en datalagringskonsulent - dummies
En god datalagringskonsulent har vissa förmågor vid hanteringen med människor och kunskap om olika aspekter av datalagring. Denna lista ger dig möjlighet till några få kunskaper som alla datalagringskonsulter ska ha. Bred vision Även en datalagringskonsult som är expert på ett visst område (stjärnschema-design ...
Tio källor till aktuell information om datalagring - dummies
Du förmodligen kommer inte att bli förvånad att höra att termen aktuell information om datalagring betyder "gå och titta på Internet. "Det är värt din tid att kolla in webbsidorna i det här kapitlet. Data Warehousing Institute På Data Warehousing Institutes omfattande webbplats hittar du dessa saker: Utbildningsinformation Kommande händelser Vit ...
Skapandet av hanterbara stora datastrukturer - dummies
När datan flyttades till den kommersiella marknaden, lagras data i plattfiler som inte innebar någon struktur. Idag kräver stora data hanterbara datastrukturer. När företagen behövde få en detaljerad förståelse om kunderna, var de tvungna att tillämpa brutkrafter metoder, inklusive mycket detaljerade programmeringsmodeller för att skapa något värde. Senare i ...
Text Analytics för ostrukturerad stor data - dummies
Det finns många metoder för att analysera ostrukturerade data för ditt stora datainitiativ. Historiskt kom dessa tekniker ut av tekniska områden som NLP (Natural Language Processing), kunskapsupptäckt, datautvinning, informationshämtning och statistik. Textanalys är processen att analysera ostrukturerad text, extrahera relevant information och omvandla den till strukturerad information som då kan ...
Tio frågor att tänka på när du väljer användarverktyg - dummies
Få saker är mer frustrerande än att framgångsrikt bygga ett datalager och sedan göra det gjort oanvändbart av mindre än tillfredsställande användarverktyg. Denna lista innehåller några frågor att överväga när du utvärderar verktyg som du kanske vill köpa. Vill jag ha ett smorgasbord eller en sitta ner restaurang? Satsa på att du inte förväntade dig en fråga så här ...
Data Warehouse Supreme dummies
Dagens moderna datalager ser typiskt ut som ett komplicerat datalagrings deluxe . Imorgonens datalagring kommer dock att vara - det datalagret högsta - ser ganska annorlunda ut. Det finns få företag som har vågat i den här riktningen, men på grund av den totala kostnaden och kapaciteten är det fortfarande sällsynt att hitta många data warehouse supremes. ...
Tio tecken på ett datalagringsprojekt i problem - dummies
Du kan lättast säga att dina data lagringsprojekt är i trubbel när du inte har något att visa för dina ansträngningar när du trodde du skulle. Försök få någon indikation på att problem är att brygga, men innan du når den punkten. Denna lista presenterar tio tidiga varningsskyltar. Projektets omfattningsfas slutar med ...
Tio hemligheter att hantera ditt projekt framgångsrikt - dummies
Att vara en framgångsrik datalagringsprojektledare innebär att du måste göra mer - mycket mer - än bara skapa projektplaner och be gruppmedlemmar att vända sig i veckovisa statusrapporter. Här är några hemligheter till framgång. Berätta om det är det Det spelar ingen roll om du arbetar med användare, verkställande sponsorer, ...
Utvecklingen av implementeringsmodeller i Big Data Era - dummies
Med tillkomsten av stora data , implementeringsmodellerna för hantering av data ändras. Det traditionella datalagret implementeras typiskt på ett enda stort system inom datacentret. Kostnaderna för denna modell har lett organisationer att optimera dessa lager och begränsa omfattningen och storleken på de data som hanteras. Men när ...