Hantera data i NoSQL - dummies - Personliga finanser 2025

När du lyckats hantera nycklarna är du redo att utforma hur du lagrar data med NoSQL och se till att den är säker och alltid tillgänglig för arbetet du behöver göra.

Datatyper i viktiga värdebutiker

Viktiga butiker fungerar normalt som & ldquo; hinkar & rdquo; för binär data. Vissa databaser ger stark intern datatyping och till och med schema support. Andra ger helt enkelt praktiska hjälparfunktioner i sina klientdrivrutiner för serialisering av vanliga applikationsdatastrukturer till en nyckelvärdesbutik. Exempel är kartor, listor och sorterade uppsättningar.

Oracle NoSQL kan fungera i två lägen:

Enkel binär butik
Starkt strukturerat Avro schema stöd

Ett Avro schema är relaterat till ett relationsdatabasschema - verkställer en mycket stringent uppsättning av formatregler för JavaScript Object Notation (JSON) data lagrad i databasen, som illustreras här:

{användarnamn: & ldquo; afowler & rdquo;, sessionid: 13452673, sedan: 1408318745, tema: & ldquo; bluesky & rdquo;}

Du definierar ett Avro-schema med ett JSON-dokument. Detta är ett exempel på Avro-schemat för den lagrade data som visats tidigare:

{& ldquo; Typ & rdquo;: & ldquo; rekord & rdquo;, & ldquo; namespace & rdquo;: & ldquo; com. ex & rdquo;, & ldquo; namn & rdquo;: & ldquo; UserSession & rdquo;, & ldquo; fält & rdquo;: [{& ldquo; namn & rdquo;: & ldquo; användarnamn och rdquo;, & ldquo; Typ & rdquo;: [& ldquo; string & rdquo;, & rdquo; null & rdquo;]}, {& ldquo; namn & rdquo;: & ldquo; sessionid & rdquo;, & ldquo; Typ & rdquo;: & ldquo; int & rdquo;}, {& ldquo; namn & rdquo;: & ldquo; eftersom & rdquo;, & ldquo; Typ & rdquo;: & ldquo; lång & rdquo;}, {& ldquo; namn & rdquo;: & ldquo; tema & rdquo;, & ldquo; Typ & rdquo;: [& ldquo; string & rdquo;, & rdquo; null}]}}

Ett Avro-schema ger mycket starkt skrivning i databasen för när schemat är viktigt. I föregående exempel ser du strängdata, ett numeriskt sessions-ID, ett datum (millisekunder, sedan Unix Time Epox, som ett långt heltal) och en personaliseringsinställning för det tema som ska användas på webbplatsen.

Observera också att typ av användarnamn och tema har två alternativ - sträng och null, vilket är hur du instruerar Oracle NoSQL att nollvärden är tillåtna. Du kunde ha lämnat temat som en sträng och tillhandahöll en ytterligare konfigurationsparameter för & ldquo; default & rdquo;: & ldquo; Bluesky & rdquo;.

Andra NoSQL-databaser ger sekundära index på någon godtycklig egenskap med ett värde som har JSON-innehåll. Riak tillhandahåller till exempel sekundära index som baseras på dokumentpartitionering - i grunden indexeras en känd egenskap inom ett JSON-dokument med en typ.Detta möjliggör intervjufrågor (mindre än eller högre än) förutom enkla lika och inte lika jämförelser. Riak klarar av att tillhandahålla intervjufrågor utan ett stringent schema - bara enkel indexdefinition. Om data finns där läggs det till i indexet.

Replikera data

Lagring av flera kopior av samma data på andra servrar, eller till och med rack av servrar, hjälper till att säkerställa tillgängligheten av data om en server misslyckas. Serverfel händer huvudsakligen i samma kluster.

Du kan använda replika två huvudvägar:

Master-slave: Alla läser och skriver sker med mästaren. Slaver tar över och mottar endast förfrågningar om befälhavaren misslyckas.

Master-slave replikering används vanligtvis på ACID-kompatibla nyckelvärdesbutiker. För att möjliggöra maximal konsistens skrivs primäraffären till och alla replikor uppdateras innan transaktionen fullbordas. Denna mekanism kallas en tvåfas commit och skapar extra nätverk och behandlingstid på replikorna.

Master-master: Läser och skriver kan hända på alla noder som hanterar en nyckel. Det finns inget begrepp av en & ldquo; primär & rdquo; partition ägare.

Master-master-repliker är i regel ibland konsekventa, med klustret som utför en automatisk operation för att bestämma det senaste värdet för en nyckel och avlägsna äldre, vanliga värden.

I de flesta viktiga värdebutiker sker detta långsamt - vid läsningstid. Riak är undantaget här, eftersom det har en anti-entropitjänst som kontrollerar konsistens under normala operationer.

Versionsdata

För att aktivera automatisk konfliktlösning behöver du en mekanism för att indikera den senaste versionen av data. Eventuellt konsekventa viktiga värdebutiker uppnår konfliktlösning på olika sätt.

Riak använder en vektor-klockmekanism för att förutse vilken kopia som är den senaste. Andra viktiga värdebutiker använder enkla tidsstämplar för att indikera stalenhet. När konflikter inte kan lösas automatiskt skickas båda kopiorna av data till klienten. Konflikterande data som skickas till klienten kan uppstå i följande situation:

Klient 1 skriver till replik A 'Adam: {likes: Cheese}'.
Replica En kopia data till replika B.
Klient 1 uppdaterar data på replik A till "Adam: {gillar: Ost, hatar: solljus} '.

På den här tiden har replik A inte tillräckligt med tid för att kopiera de senaste data till replik B.
Klient 2 uppdaterar data på replik B till 'Adam: {likes: Dogs, hates: kangaroos}'.

Vid denna tidpunkt är replik A och replik B i konflikt och databasklustret kan inte automatiskt lösa skillnaderna.

En alternativ mekanism är att använda tidsstämplar och lita på att de anger de senaste uppgifterna. I en sådan situation är det sunt för applikationen att kontrollera att tidsstämplarna läser det senaste värdet innan du uppdaterar värdet.

De kontrollerar -kontrollen och ställer in -mekanismen, som i princip betyder 'Om den senaste versionen fortfarande är version 2, spara sedan min version 3'. Denna mekanism kallas ibland Read Match Update (RMU) eller Read Match Write (RMW). Denna mekanism är standardmekanismen som används av Oracle NoSQL, Redis, Riak och Voldemort.