Innehållsförteckning:
- Stora dataunderlag: RDBMS och ihållande data
- Stora dataunderlag: RDBMS och tabeller
- PostgreSQL, en relationsdatabas för öppen källkod
Video: Understanding Document Stores as an Alternative to RDBMS for Unstructured and Big Data 2024
Stora data blir ett viktigt element i hur organisationer använder högvolyldata i rätt hastighet för att lösa specifika data problem. Relationella databashanteringssystem är viktiga för denna höga volym. Stora data lever inte isolerat. För att vara effektiva måste företagen ofta kombinera resultaten av stor dataanalys med de uppgifter som finns inom verksamheten.
Stora dataunderlag: RDBMS och ihållande data
En av de viktigaste tjänsterna från operativa databaser (även kallad datalager ) är uthållighet. Persistens garanterar att data som lagras i en databas inte kommer att ändras utan behörigheter och att den kommer att finnas tillgänglig så länge det är viktigt för verksamheten. Vilken bra är en databas om den inte kan lita på att skydda de data du lägger i den?
Med tanke på det här viktigaste kravet måste du då tänka på vilken typ av data du vill fortsätta, hur kan du komma åt och uppdatera den, och hur kan du använda den för att göra affärsbeslut. På den här grundläggande grunden är valet av dina databasmotorer avgörande för din övergripande framgång med din stora dataimplementering.
Även om den underliggande tekniken har funnits länge, är många av dessa system i drift idag eftersom de företag de stöder är högt beroende av data. Att ersätta dem skulle vara likvärdigt med att byta motorer av ett flygplan på en transoceanisk flygning.
Stora dataunderlag: RDBMS och tabeller
Relationsdatabaser är byggda på en eller flera relationer och representeras av tabeller. Dessa tabeller definieras av sina kolumner, och data lagras i raderna. Den primära nyckeln är ofta den första kolumnen i tabellen. Databasens konsistens och mycket av dess värde uppnås genom att "normalisera" data. Normaliserade data har konverterats från inbyggt format till ett gemensamt, överenskommet format.
Till exempel i en databas kan du ha "telefon" som XXX-XXX-XXXX medan den i en annan kan vara XXXXXXXXX. För att få en konsekvent bild av informationen måste fältet normaliseras till en annan form. Fem nivåer av standarder finns för normalisering. Valet av normal form förkastas ofta till databasdesignern. Samlingen av tabeller, nycklar, element och så vidare kallas databasen schema.
Under det senaste året har det strukturerade frågespråket (SQL) utvecklats i låsningssteg med RDBMS-teknik och är den mest använda mekanismen för att skapa, fråga, upprätthålla och fungera relationsdatabaser.
I företag, både små och stora, är de flesta av deras viktiga operativa uppgifter förmodligen lagrade i RDBMS. Många företag har olika RDBMS för olika verksamhetsområden. Transaktionsdata kan lagras i en leverantörs databas, medan kundinformation kan lagras i en annan.
Det är inte troligt att du kommer att använda RDBMS för kärnan i implementeringen, men du måste förlita dig på data lagrade i RDBMSs för att skapa den högsta värdet för verksamheten med stora data.
PostgreSQL, en relationsdatabas för öppen källkod
Under din stora dataimplementering kommer du sannolikt att komma över PostgreSQL, en utbredd databas för öppen källkod. Flera faktorer bidrar till populariteten hos PostgreSQL. Som RDBMS med stöd för SQL-standarden gör allt det som förväntas i en databasprodukt, plus dess lång livslängd och bred användning har gjort det "slagetestat. "Det finns även på nästan alla operativsystem, från datorer till mainframes.
Att tillhandahålla grunderna och göra det på ett tillförlitligt sätt är bara en del av berättelsen. PostgreSQL stöder också många funktioner som endast finns i dyra, egna RDBMS-filer, inklusive följande:
-
Möjlighet att direkt hantera "objekt" i relationsschemat
-
Utländska nycklar (referensnycklar från en tabell till en annan)
-
Utlösare (händelser används för att automatiskt starta en lagrad procedur)
-
Komplexa frågor (delfrågor och anslutningar över diskreta tabeller)
-
Transaktionsintegritet
-
Multiversion samtidighetskontroll
PostgreSQLs verkliga kraft är dess utsträckbarhet. Användare och databasprogrammerare kan lägga till nya funktioner utan att påverka databasens grundläggande funktion eller tillförlitlighet. Möjliga tillägg inkluderar
-
Datatyper
-
Operatörer
-
Funktioner
-
Indexeringsmetoder
-
Procedurespråk
Denna höga anpassningsnivå gör PostgreSQL önskvärt när styva, proprietära produkter inte kommer att få jobbet gjort. Det är oändligt utdragbart.
Till sist tillåter PostgreSQL-licensen ändring och distribution i någon form, öppen eller sluten källa. Eventuella ändringar kan hållas privata eller delas med samhället som du önskar.