Tio ämnesområden att täcka med datalagringsleverantörer - dummies
Här är tio ämnesområden som du borde diskutera med vilken datalagringsproduktleverantör som helst, oavsett vilken produktkategori (Business Intelligence Tool, Middleware Tool, eller RDBMS, till exempel) du funderar på att köpa. Det finns också en specifik fråga som du kanske vill fråga. Alla dessa frågor är något udda för att de inte har något att göra med ...
Data Warehouse Futures i Big Data Era - dummies
Data Warehouse Market har faktiskt börjat förändras och utvecklas med framkomsten av stora data. Tidigare var det helt enkelt inte ekonomiskt för företag att lagra den enorma datamängden från ett stort antal rekordsystem. Bristen på kostnadseffektiva och praktiska distribuerade datortekniker medförde att en data ...
Data Warehouse Lite-dummies
En datalagrings lite är en no-frills, bare-ben, low-tech approach att tillhandahålla data som kan hjälpa till med några av dina beslutsfattande. No-frills innebär att du, där det är möjligt, sätter samman bevisade funktioner och verktyg som redan finns inom din organisation för att bygga upp ditt system. Ämnesområden och datainnehåll i ett datalagringslitet Ett datalager ...
Förhållandet mellan instrumentbrädor, scorecards och andra delar av Business Intelligence - dummies
Instrumentpaneler och scorecards är ofta kopplade till resultat från andra affärsinformationsverktyg, som representerar en presentationsmekanism, snarare än en analytisk mekanism. Du kan till exempel skapa "sidor" i en informationsbok från resultaten av olika standardiserade rapporter (springa från rapporteringsverktyget) förutom en rudimentär flerdimensionell analys från organisationens ...
Utvecklingen av distribuerad dator för stora data - dummies
Bakom alla viktiga trender under det senaste decenniet, inklusive serviceorientering, cloud computing, virtualisering och stora data, är en grundläggande teknik som kallas distribuerad databehandling. Enkelt uttryckt, utan att distribuera datorer, skulle ingen av dessa framsteg vara möjliga. Distribuerad databehandling är en teknik som gör det möjligt för enskilda datorer att nätverkas ihop över geografiska områden som om ...
Tre leverantörer med data miningprodukter - dummies
Det finns flera leverantörer som säljer data miningprodukter som du kanske vill överväga använder med ditt datalager. Här är tre som är värda att överväga. Microsoft Microsoft introducerade server-side data mining med Microsoft SQL Server 2005. Även om det inte är lika moget och sofistikerat som SAS och SPSS, har Microsoft bevisat över tiden sin förmåga ...
Grunddata för stor dataintegration - dummies
De grundläggande elementen i den stora dataplattformen hanterar data på nya sätt som jämfört med den traditionella relationella databasen. Detta beror på behovet av skalbarhet och hög prestanda som krävs för att hantera både strukturerad och ostrukturerad data. Komponenterna i det stora dataukosystemet från Hadoop till NoSQL DB, MongoDB, Cassandra, ...
Tre aspekter av samarbetande affärsintelligens - dummies
Samverkansrelaterad affärsinformation är en miljö där användare enkelt kan samarbeta och kommunicera med varandra, dela idéer, information och beslutsfattande inom deras samhälle. Kunskapshållning Varje dag fångar ingen miljontals objekt av immateriella rättigheter (samtal, e-post och telefonsamtal) i organisationer över hela världen. Med hjälp av samarbetsprogramvara till ...
Top-Down, Quick-Strike Data Marts - dummies
Ibland har du bara inte ett datalager för att få data för din data mart, så du måste själv källa data från applikationer. I många (förmodligen mest) av dessa situationer skapar du en snabb data-mart - i verkligheten, ett miniatyrdatagalleri, men byggt för att möta kraven på en ...
Tips för datalagringskonsulter - dummies
Mest information på denna webbplats om datalagring är främst inriktad mot användargemenskapen och hur människorna i den kan hitta och behålla konsulter för sina datalagringsprojekt. Om du är en datalagringskonsult, är det här några tips: Rådgör med alla förändringar som sker i ...
Traditionella datalagringsmedel analyserar traditionella datatyper - dummies
Vid planering för datalagring, kom ihåg att dagens data Landskapet omfattar nu ett svimlande utbud av nya informationskanaler, nya datakällor och nya analys- och rapporteringsbehov. Enligt analytikergrupper är nästan 80 till 85 procent av dagens data ostrukturerad och nya informationskanaler som webb, e-post, voice over IP, instant ...
Varningar för Big Data Cloud Users - dummies
Varning! Cloud-baserade tjänster kan ge en ekonomisk lösning på dina stora dataförbrukningar, men molnet har sina problem. Det är viktigt att du gör dina läxor innan du flyttar dina stora data där. Här är några frågor att överväga: Dataintegritet: Du måste se till att din leverantör har rätt kontroller på plats för att säkerställa ...
Visa externa data från användarens perspektiv - dummies
Här är en översikt över hur en datalagringsanvändare ser externt data och dess betydelse. Tänk på dessa två tabeller. Tabellen visar försäljningsresultatet för Good Guys, Inc. och följande tabell visar försäljningsprestandan för de konkurrerande Bad Guys, Inc. Good Guys, Inc. Försäljningsresultat Region 2007 Q1 Resultat 2008 Q1 ...
Vilken funktionalitet ger ett frågeformulär och rapporteringsverktyg? - dummies
För att hjälpa dig att förstå den funktionalitet som ett fråge- och rapporteringsverktyg erbjuder, den här listan beskriver några av de uppgifter de kan hjälpa dig att utföra: Kör regelbundna rapporter. Din organisation kan regelbundet producera standardrapporter som kommer från ett operativsystem eller från data som extraheras från ett eller flera av dessa system. Skapa organiserade listor. ...
Vad är Middleware? - dummies
Definieras löst, middleware är en uppsättning tjänster som utför olika funktioner i en distribuerad datormiljö, över ett stort antal serverns och klientsystem. I grunden är middleware datorprogramvara som förbinder programkomponenter. Här är några typer av middleware-tjänster: Säkerhet: Godkänner ett visst klientprogram till någon systemkomponent för att verifiera, ...
Kolliderar ideen bakom multidimensionella databaser - dummies
Multidimensionella databaser (MDDB) deras konventionsförfäder och organiserar data på ett sätt som bidrar starkt till multidimensionell analys. För att förstå multidimensionella databaser måste du först förstå grunderna för de analytiska funktionerna som utförs med data lagrade i dem. Multidimensionell analys är uppbyggd kring några enkla dataanalyser ...
Ostrukturerad data i en stor datamiljö - dummies
Ostrukturerad data är data som inte följer ett visst format för stora data. Om 20 procent av de uppgifter som är tillgängliga för företag är strukturerad data är de övriga 80 procent ostrukturerad. Ostrukturerad data är egentligen de flesta data som du kommer att stöta på. Hittills har tekniken inte stött mycket på att göra mycket med ...
Varför är externa data viktiga för ditt datalager? - dummies
Externa data - från ditt eget företag - är viktigt för ditt datalager av en enkel anledning: För att du ska kunna fatta rätt affärsbeslut måste du se den stora bilden, vilket vanligtvis betyder att du kan inte hitta alla svar som finns lagrade i ditt företags olika datorprogram och databaser. Här är ...
Varför ska du använda Hadoop för stora data? - dummies
Sökmotorer som Yahoo! och Google mötte ett problem med mossa. De behövde hitta ett sätt att förnuftiga de enorma mängder data som deras motorer samlade. Dessa företag behövde både förstå vilken information de samlade och hur de kunde tjäna pengar på dessa data för att stödja deras ...
Enterprise Data Management och Big Data - dummies
Enterprise Data Management (EDM) är en viktig process i stora data för förstå och kontrollera ekonomi av data i ditt företag eller organisation. Även om EDM inte krävs för stora data, kommer korrekt tillämpning av EDM att bidra till att säkerställa bättre integration, kontroll och användbarhet av stora data. EDM är ett omfattande tillvägagångssätt för ...
Vad är ett relationsdatabasstyrningssystem? - dummies
Glömmer allt om relativmodellens matematiska grundval, principerna för normalisering och andra högteknologiska aspekter av RDBMS. Om du är intresserad, kontakta någon av de många tillgängliga läroböcker som diskuterar RDBMS principer och teknik i detalj. Ett RDBMS är ett mjukvarusystem som hanterar relationsdatabaser. Så, vad är en relationsdatabas? ...
Vad behöver Management veta om datalagring? - dummies
Någonstans i din organisatoriska hierarki, har någon kontroll över budgeterade medel som han eller hon kan allokera till ditt datalagringsprojekt eller till ett annat projekt någon annanstans i organisationen, för att köpa kapitalutrustning (fler datorer, till exempel ), eller att betala för något annat syfte. Vem behöver säljas på datalagringsprojektet ...
Experiment i Direct Marketing - dummies
Kanske den vanligaste applikationen för experiment i datautvinning, legitimerade kontrollerade experiment som de som som forskare använder, är direktmarknadsföring. Direktmarknadsföring innebär att man kontaktar enskilda personer. När du får en text eller ett e-postmeddelande från en återförsäljare, är det direkt marknadsföring. Traditionella postorderkataloger, telefonsamtal från välgörenhetsorganisationer och kampanjbokstäver från ...
Vad ska man göra om DataMad - dummies
Om en data mart är en mindre skala av en datalager, kommer denna fråga upp: Vad betyder "mindre skala" med hänvisning till innehållet i en data mart? Svaret på denna fråga är typiskt att uppgifterna kommer att vara en delmängd av de totala företagsuppgifterna. Geografisk begränsad data En data mart kan ...
Varför molnet är viktigt för stora data - dummies
Finns många kombinationer av implementerings- och leveransmodeller för stora data i molnet. Till exempel kan du använda ett offentligt moln IaaS eller ett privat moln IaaS. Så, vad betyder detta för stora data och varför är molnet en bra passform för det? Tja, stora data kräver distribuerade kluster av beräkningskraft, ...
Utöka ditt datalag med NoSQL-dummies
En databas gör en sak mycket bra: det lagrar data. Men eftersom alla applikationer behöver ytterligare programvara för att vara komplett, är det värt att se till att din valda NoSQL-databas har verktygen och partnerprogramvaran som ger den utökade funktionaliteten du behöver. Att inte garantera att utökad funktionalitet stöds innebär att du kommer sluta installera ...
Hur man hittar antalet element i en dataström - dummies
ÄVen om en blom filter kan spåra objekt som kommer från en ström, det kan inte berätta hur många objekt som finns där. En liten vektor fylld av en kan (beroende på antalet haschar och sannolikheten för kollision) gömma det sanna antalet objekt som har hashed på samma adress. Att veta det tydliga antalet ...
Formatering av data korrekt - dummies
Människor använder erfarenhet när de tolkar de data de ser, men datorer kan inte. Din data-mining programvara kommer att göra sitt bästa för att identifiera vilken typ av data i varje kolumn, men datatyper är ofta tvetydiga. När du ser en lista med postkoder försöker du inte lägga till och dras av dem. Du vet att de ...
Fem planer för stor datasuccé - dummies
Medan stora data endast är i de första stadierna, du vill planera för framgång. Det är aldrig för tidigt att komma igång med planering och god praxis så att du kan utnyttja det du lär dig och den erfarenhet du uppnår. Planera dina stora data mål Många organisationer startar sin stora datatur ...
Fyra planer med affärsplanering med stora data - dummies
Vad hoppas affärsplanen genom att utnyttja stora data? Det här är inte en lätt fråga att svara på. Olika företag i olika branscher måste hantera sina uppgifter olika. Men några vanliga affärsproblem är i centrum för hur stora data anses vara ett sätt att både planera ...
3 Hadoop-klusterkonfigurationer - dummies
Många av de beslut som du behöver göra när det gäller kompositionen av rack och nätverk är beroende på omfattningen av ditt Hadoop-kluster. Den har tre huvudsakliga permutationer.
Att få algoritmer till företag - dummies
Mänskligheten är nu på en otrolig skärningspunkt av oöverträffade datamängder som genereras av alltmer mindre och kraftfull maskinvara, och analyseras av algoritmer att samma process bidrog till att utvecklas. Det handlar inte bara om volym, vilket i sig är en svår utmaning. Som formaliserades av forskningsbolaget Gartner 2001 och ...
Apache Drill - dummies
Apache Drill är ett kandidatprojekt i Apache-inkubatorn. Apache Drill är dock inte särskilt sjuk. Apache Software Foundation (ASF) kandidat teknik börjar alla som inkubatorprojekt innan de blir officiella ASF-tekniker. Du kan läsa om Apache-inkubatorn. Du kan läsa om Drill. Inspirerat av Googles Dremel-teknik, har det angivna prestationsmålet för ...
Kolumner Familjer i HBase Data Model - dummies
I kolonnerna HBase-datamodeller grupperas i kolumnfamiljer, vilket måste definieras uppe under bordet skapande. Kolumnfamiljer lagras tillsammans på disk, varför HBase kallas en kolumnorienterad datalager. Logisk vy av kundkontaktinformation i HBase Row-nyckelkolumnfamilj: {Kolumnkvalificator: Version: Värde} 00001 Kundenamn: ...
Alternativa distributionsformfaktorer för Hadoop dummies
Men Hadoop fungerar bäst när den är installerad på en fysisk dator där bearbetning har direkt tillgång till dedikerad lagring och nätverk, Hadoop har alternativa implementeringar. Och även om de är mindre effektiva än den dedikerade hårdvaran, är alternativ i vissa fall bra alternativ. Virtuella servrar En stor trend inom IT-centra under det senaste decenniet ...
ACID versus BASE Data Stores - dummies
Ett kännetecken för relationsdatabassystem är något som kallas ACID-överensstämmelse. Som du kanske har gissat är ACID en akronym - de enskilda bokstäverna, som är avsedda att beskriva en egenskap hos enskilda databasstransaktioner, kan utökas enligt beskrivningen i denna lista: Atomicitet: Databasstransaktionen måste helt lyckas eller helt misslyckas. Delvis framgång är ...
Konfigurera Oozie Workflows - dummies
Som en arbetsflödesmotor, gör det möjligt för Oozie att köra en uppsättning Hadoop-applikationer i en specificerad sekvens som är känd som ett arbetsflöde. Du kan konfigurera Oozie-arbetsflöden på ett av tre sätt, beroende på dina speciella omständigheter. Du kan använda config-default. xml-fil: Definierar parametrar som inte ändras för arbetsflödet. Jobbet. Egenskapsfil: Definierar ...