Hem Personliga finanser Distribuerad databas för Big Data - dummies

Distribuerad databas för Big Data - dummies

Innehållsförteckning:

Video: DFS on Server 2016 - Step by Step 2024

Video: DFS on Server 2016 - Step by Step 2024
Anonim

Om ditt företag överväger ett stort dataprojekt är det viktigt att du förstår vissa distribuerade databaser först. Det finns ingen enskild distribuerad datormodell eftersom beräkningsresurser kan distribueras på många sätt.

Du kan till exempel distribuera en uppsättning program på samma fysiska server och använda meddelandetjänster för att de ska kunna kommunicera och skicka information. Det är också möjligt att ha många olika system eller servrar, var och en med eget minne, som kan fungera tillsammans för att lösa ett problem.

Varför distribuerad databas behövs för stora data

Inte alla problem kräver distribuerad databehandling. Om en stor tidsbegränsning inte existerar kan komplex bearbetning ske via en specialiserad tjänst på distans. När företag behövde göra komplicerad dataanalys, skulle IT flytta data till en extern tjänst eller enhet där många reservresurser var tillgängliga för bearbetning.

Det var inte så att företag ville vänta för att få de resultat de behövde; det var bara inte ekonomiskt möjligt att köpa tillräckligt med datorresurser för att hantera dessa nya krav. I många situationer skulle organisationer fånga endast val av data istället för att försöka fånga all data på grund av kostnader. Analytiker ville ha alla uppgifter men var tvungna att lösa sig för ögonblicksbilder, i hopp om att fånga rätt data vid rätt tidpunkt.

Viktiga hårdvaru- och programvaruproblem revolutionerade datahanteringsindustrin. För det första ökade innovation och efterfrågan kraften och minskade priset på hårdvara. Ny mjukvara uppstod som förstod hur man utnyttjar den här hårdvaran genom att automatisera processer som lastbalansering och optimering över ett stort antal nodar.

Programvaran innehöll inbyggda regler som förstod att vissa arbetsbelastningar krävde en viss prestationsnivå. Programvaran behandlade alla noder som om de helt enkelt var en stor pool av databehandling, lagring och nätverkstillgångar och flyttade processer till en annan nod utan avbrott om en nod misslyckades, med hjälp av virtualiseringstekniken.

Den förändrade ekonomin i databehandling och stora data

Snabbspolning och mycket har ändrats. Under de senaste åren har kostnaden för inköp av datorer och lagringsresurser minskat dramatiskt. Med hjälp av virtualisering kan råvareservrar som kan klustras och blad som kan nätverksförsedd i en rack ändrat ekonomin i databehandling. Denna förändring sammanföll med innovation i mjukvaruautomatiseringslösningar som dramatiskt förbättrade hanterbarheten hos dessa system.

Förmågan att utnyttja distribuerad databehandling och parallell bearbetningsteknik omvandlade landskapet dramatiskt och dramatiskt reducerar latensen. Det finns speciella fall, till exempel High Frequency Trading (HFT), där låg latens endast kan uppnås genom att fysiskt lokalisera servrar på en enda plats.

Problemet med latens för stora data

Ett av de fleråriga problemen med att hantera data - särskilt stora mängder data - har haft påverkan av latens. Latency är förseningen inom ett system baserat på förseningar vid utförandet av en uppgift. Latency är ett problem i alla aspekter av databehandling, inklusive kommunikation, datahantering, systemprestanda och mer.

Om du någonsin har använt en trådlös telefon har du upplevt latentitet på första hand. Det är förseningen i överföringen mellan dig och din ringer. Ibland har latens liten inverkan på kundtillfredsställelse, till exempel om företag behöver analysera resultat bakom kulisserna för att planera för en ny produktutgåva. Detta kräver nog inte omedelbar respons eller åtkomst.

Ju närmare det här svaret är hos en kund vid tidpunkten för beslutet desto mer är det latent.

Distribuerad databehandling och parallell bearbetningsteknik kan göra en signifikant skillnad i latensen som kunder, leverantörer och partners upplever. Många stora dataprogram är beroende av låg latens på grund av de stora datakraven för hastighet och volymen och olika data.

Det är kanske inte möjligt att konstruera en stor dataprogram i en hög latent miljö om hög prestanda behövs. Behovet av att verifiera uppgifterna i nära realtid kan också påverkas av latens. När du hanterar realtidsdata betyder en hög latensnivå skillnaden mellan framgång och misslyckande.

Stor datakrav möter lösningar

Internetens tillväxt som plattform för allt från handel till medicin förvandlade efterfrågan på en ny generation datahantering. I slutet av 1990-talet, motor och internet företag som Google, Yahoo!, och Amazon. com kunde expandera sina affärsmodeller, utnyttja billig hårdvara för beräkning och lagring.

Därefter behövde dessa företag en ny generation av programvaruteknik som skulle göra det möjligt för dem att tjäna pengar på de enorma mängder data som de fängslade från kunderna. Dessa företag kunde inte vänta på resultat av analytisk bearbetning. De behövde förmågan att bearbeta och analysera dessa data i nära realtid.

Distribuerad databas för Big Data - dummies

Redaktörens val

Hur man lägger till text i en sätter () Funktion i C Programmering

Hur man lägger till text i en sätter () Funktion i C Programmering

När du behöver visa en annan textrad, använd C-programmeringsfärdigheterna för att skapa en annan puts () -funktion i källkoden, som visas i Visa två textlinjer. VISA TILL TEXTFINER # inkludera int main () {sätter ("Hickory, Dickory, Dock,"); sätter ("musen sprang klockan."); returnera (0);} Den andra ...

Förklarar variabler i C-dummies

Förklarar variabler i C-dummies

Variabler är det som gör dina program zooma. Programmering kan bara inte bli gjort utan dem. Så om du inte har introducerats till variabler än, här går du. Valerie Variable är en numerisk variabel. Hon älskar att hålla nummer - vilket nummer som helst; det spelar ingen roll. När hon ser ett lika tecken tar hon ett värde och ...

Redaktörens val

Gör rädsla för din vän - dummies

Gör rädsla för din vän - dummies

Rädsla är lika verklig som mod. Även om värdet av rädsla inte är lika uppenbart som modets värde, har det dess fördelar. Rädsla är din instinkt som säger att du är obehaglig - även om situationen inte kommer att skada dig. Alla har haft den känslan när man hellre drar locket ...

Hur man ökar din självmedvetenhet - dummies

Hur man ökar din självmedvetenhet - dummies

Du kommer att vara med dig själv under en livstid. Ingenting kommer att förändra det faktum. Att lära känna, som att lyssna på och uppskatta själv är avgörande för din sanity. Kanske kommer du till att älska, acceptera och omfamna alla du är, är svår för dig att föreställa dig just nu, men du kan göra ...

Hur man ökar din mentala flexibilitet - dummies

Hur man ökar din mentala flexibilitet - dummies

ÄR flexibel i arbete och relationer är ett tecken på en högpresterande. Medan perfektionister är styva och obehagliga i sitt arbete och hur de interagerar med andra, är högpresterande mer öppna och tillmötesgående. Att vara mer flexibel på jobbet gav Ralph aldrig förslag under brainstorming vid gruppmöten. Han kände att hans lag ...

Redaktörens val

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Nätverksadministration: Linux-installation och virtuella konsoler - dummies

Linux är i sig ett kommandoradsorienterat operativsystem. Grafiska användargränssnitt - inklusive installationsprogrammets GUI - tillhandahålls av en valfri komponent som heter X Window System. Men medan du arbetar med det grafiska användargränssnittet för installationsprogrammet, håller Linux flera ytterligare kommandorads-konsoler öppna. Normalt behöver du inte ...

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Nätverksadministration: Linux-loggning, logg och systemavstängning - dummies

Alla användare som åtkomst ett Linux-system, lokalt eller över ett nätverk, måste verifieras av ett giltigt användarkonto på systemet. I det följande får du veta hur du loggar in och ut på ett Linux-system och hur du stänger av systemet. Logga in När Linux startar upp visas det ...

Nätverksadministration: Licensserver - Dummies

Nätverksadministration: Licensserver - Dummies

I vissa program kan du köpa nätverkslicenser som gör att du kan installera programvaran på många datorer som du vill, men reglera antalet personer som kan använda programvaran vid en viss tidpunkt. För att styra hur många som använder programvaran, är en särskild licensserver inrättad. När en användare börjar ...