Innehållsförteckning:
- Entity extraction and enrichment
- Sök och varning
- När du har hittat relevant information kanske du vill gräva djupare. Beroende på källan kan du fråga hur många länder som har en BNP på mer än 400 miljarder dollar, eller hur mycket är medeltiden för alla medlemmar i ditt släktträd eller var sker de flesta ormbett i Australien. Dessa exempel illustrerar hur analyser utförs över en uppsättning sökresultat. Dessa är räkning, medelvärde och geospatial värmekortberäkning.
- Nästa uppenbara användargränssnittstillägg omfattar kartläggning och visning av tabellöversikter för direktadministrationsinformation och historisk analys av affärsunderrättelser.
Video: Visualisering av mervärden av energieffektivisering i småhus 2024
Det går bra att lagra och hämta stora mängder data och göra det så snabbt, och när du har din nyligen hanterade data i NoSQL kan du göra bra saker.
Entity extraction and enrichment
Du kan använda databasutlösare, alert actions och externa system för att analysera källdata. Kanske är det mestadels gratis text men nämner kända ämnen. Dessa utlösare och varningsåtgärder kan markera texten som en person eller organisation som effektivt märker själva innehållet och dokumentet det ligger inom.
Ett bra exempel är innehållet i en nyhetsartikel. Du kan använda ett verktyg som Apache Stanbol eller OpenCalais för att identifiera nyckelord. Dessa verktyg kan se "president Putin" och bestämma att det här gäller en person som heter Vladimir Putin, som är rysk, och är Rysslands nuvarande president.
Andra exempel inkluderar sjukdoms- och medicinnamn, organisationer, diskussionsämnen, nämnda produkter och om en kommentar var positiv eller negativ.
Dessa är alla exempel på enhetens extraktion (vilket är processen att automatiskt extrahera typer av objekt från deras textnamn) . Genom att identifiera nyckelord kan du märka dem eller lägga dem i ett XML-element, vilket hjälper dig att söka innehåll mer effektivt.
Enhetsberikning innebär att du lägger till information baserat på originaltexten förutom att identifiera den. I Putin-exemplet kan du vända det vanliga textordet "Putin" till president Putin. Alternativt kan du vända "London" till London.
Du kan visa dessa data i ett användargränssnitt som markerad text med en länk för mer information om varje ämne.
Du kan tillhandahålla anrikning genom att använda fri text sökning, varning, databas utlösare och integreringar till extern programvara som TEMIS Luxid och SmartLogic.
Sök och varning
När du har lagrat din information kanske du vill söka den. Fritt textsökning är enkelt, men efter att ha utfört utvinning av enheter har du fler alternativ. Du kan söka specifikt för en person som heter "Orange" (som i William of Orange) istället för sökregister som nämner ordet orange - vilket givetvis också är en färg och en frukt.
Om du gör det resulterar det i en mer granulär sökning. Det möjliggör även fasetterad navigering. Om du går till Amazon och söker efter Harry Potter ser du kategorier för böcker, filmer, spel och så vidare. Produktkategori är ett exempel på en fasett , som visar en aspekt av data i sökresultaten - det vill säga de vanligaste värdena för varje fas i alla sökresultat, även de som inte finns på den aktuella sidan. Användargränssnitt kan stödja rika utforskningar i data (såväl som grundläggande Google-esque-sökningar). Användare kan också använda dem för att spara och ladda tidigare sökningar.
Du kan ställa in sparade sökkriterier så att varningar aktiveras när nyupplagda poster matchar det här kriteriet. Så, om en ny post anländer som matchar dina sökkriterier, inträffar en åtgärd. Kanske "Putin" blir Putin
Inte alla sökmotorer kan göra varje fråga en varning. Vissa är begränsade till textfält; andra kan inte göra geospatiala kriterier. Var säker på att dina kan hantera de varningar du behöver konfigurera.
Sammanställningsfunktioner
När du har hittat relevant information kanske du vill gräva djupare. Beroende på källan kan du fråga hur många länder som har en BNP på mer än 400 miljarder dollar, eller hur mycket är medeltiden för alla medlemmar i ditt släktträd eller var sker de flesta ormbett i Australien. Dessa exempel illustrerar hur analyser utförs över en uppsättning sökresultat. Dessa är räkning, medelvärde och geospatial värmekortberäkning.
Att kunna göra sådana beräkningar bredvid data erbjuder flera fördelar. Den första fördelen är att du kan använda indexen för att påskynda sakerna. För det andra kommer dessa index troligtvis att cachas i minnet, vilket gör dem ännu snabbare. För det tredje är minnesindexer särskilt användbara för en NoSQL-databas med användning av Hadops File System (HDFS) -lagring. HDFS gör inte native indexing eller in-memory kolonn butiker för snabb aggregering beräkningar själva - det kräver en NoSQL databas överst för att göra detta.
Fasad navigering är ett exempel på count-baserade aggregeringar över sökresultat som visas i ett användargränssnitt. Detsamma gäller för en tidslinje som visar antalet poster som nämner en viss tidpunkt. Vill du till exempel visa resultat från det här året, den här månaden eller den här timmen?
Om du vill ha den här funktionen, var noga med att din databas har möjlighet att beräkna aggregat effektivt bredvid data. De flesta NoSQL-databaser gör det, men vissa gör det inte.
Kartläggning och affärsunderrättelse
Nästa uppenbara användargränssnittstillägg omfattar kartläggning och visning av tabellöversikter för direktadministrationsinformation och historisk analys av affärsunderrättelser.
De flesta NoSQL-databaser ger ett lättanpassat REST API i sina databaser. Det innebär att du kan ansluta en rad olika applikationsnivåer, eller till och med direkt ansluta JavaScript-program till dessa databaser. En mängd utmärkta kartläggningsbibliotek finns tillgängliga för JavaScript. Du kan även använda R Ekosystemet för att skapa diagram baserat på data som finns i dessa databaser, efter att ha installerat en lämplig databasanslutning.
Vissa NoSQL-databaser tillhandahåller även en ODBC- eller JDBC-relationsdatabasplug-in. Skapa index inom en given post och visa dem som en relationell vy är ett snyggt sätt att vända ostrukturerad data i en NoSQL-dokumentdatabas till data som kan analyseras med ett affärsinformationsverktyg.
Kontrollera om din NoSQL-databasleverantör tillhandahåller visualiseringsverktyg eller har affärspartners med verktyg än vad som kan anslutas till dessa databaser. I vogue-verktyg ingår Tableau Server, som är en modern delad affärsintelligensservern som stöder publicering av interaktiva rapporter över data i en mängd olika databaser, inklusive NoSQL-databaser.