Video: Att göra SOX-data sökbart med Apache Solr - talare Oscar Carlstedt och Richard Lundin 2024
Stora data har gjort det möjligt att utveckla högklassiga online-sökmotorer. En sökmotor som hittar webbsidor baserat på sökord kräver avancerade algoritmer och förmågan att behandla ett otroligt stort antal begäranden. Här är fyra av de mest använda sökmotorerna:
-
Google
-
Microsoft Bing
-
Yahoo!
-
Fråga
Användningen av Google dvärgar är dess konkurrenter. Från och med februari 2015 uppskattas Google att få 1. 1 miljarder unika besökare varje månad. Bing är en avlägsen sekund med 350 miljoner; Yahoo! får 300 miljoner och fråga, 245 miljoner. Även om Google inte är den äldsta sökmotorn, har den blivit den mest populära. Mängden data som Google hanterar varje dag beräknas vara ungefär 20 petabyte (2,0 x 10 16 byte). All denna trafik är lönsam för Google - huvuddelen av sina intäkter kommer från reklam.
Google tillhandahåller även datatjänster till organisationer som inte har egna möjligheter att bearbeta stor data. Google introducerade nyligen Google Cloud Dataflow, vilket gör det möjligt för organisationer att lagra, analysera och bearbeta enorma mängder data.