Video: Att göra SOX-data sökbart med Apache Solr - talare Oscar Carlstedt och Richard Lundin 2024
Det kan tyckas konstigt att nämna sökmotorer och NoSQL tillsammans, men många av dagens sökmotorer använder en arkitektur som mycket liknar NoSQL-databaser. Deras index och förfrågningsbehandling är mycket fördelade. Många sökmotorer är till och med kapabla att fungera som ett nyckelvärde eller en dokumentaffär i sig.
NoSQL-databaser används ofta för att lagra ostrukturerad data, dokument eller data som kan lagras i olika strukturer, t.ex. sociala medier eller webbsidor. Strukturerna för denna indexerade data varierar kraftigt.
Dokumentdatabaser är också lämpliga om systemadministratörer eller utvecklare ofta inte har kontroll över strukturerna. Denna situation är vanligt vid publicering, där ett butiksfront mottar flöden av nya böcker och deras metadata från många utgivare.
Även om utgivare använder liknande standarder som PDF och ePub för dokument och ONIX XML-filer för metadata, producerar de alla dokument på något annorlunda sätt. Som ett resultat är det svårt att hantera data noggrant, och publicering är ett bra användarfall för en dokumentdatabas.
Liknande problem förekommer i försvars- och underrättelsesvärlden. En byrå kan ta emot data från en allierad eller en terroristens hårddisk i olika format. Väntar på sex månader att utveckla ett reviderat relationsdatabasschema för att hantera en ny typ av mål är inte genomförbart! Här kan dokument NoSQL databaser användas.
Lagring av många strukturer i en enda databas kräver ett sätt att tillhandahålla en standardfrågemekanism över allt innehåll. Sökmotorer är bra för det syftet. Överväg sökningen som ett viktigt krav till ostrukturerad datahantering med NoSQL-dokumentdatabaser.
Sökteknik skiljer sig från traditionell databasgränssnittsteknik. SQL är inte en sökteknik; det är ett fråge språk. Sökning handlar om ofullkomliga matchningar och relevanspoäng, medan frågan behandlar boolesk exakt matchningslogik (det vill säga alla resultat av en fråga är lika relevanta).