Video: Apache Drill Introduction 2024
Apache Drill är ett kandidatprojekt i Apache-inkubatorn. Apache Drill är dock inte särskilt sjuk. Apache Software Foundation (ASF) kandidat teknik börjar alla som inkubatorprojekt innan de blir officiella ASF-tekniker. Du kan läsa om Apache-inkubatorn. Du kan läsa om Drill.
Inspirerat av Googles Dremel-teknik är det angivna prestationsmålet för Drill att möjliggöra SQL-frågor mot en petabyte eller mer av data distribuerad över 10 000-plus-servrar. Figuren illustrerar arkitekturen för Apache Drill.
Du kan se att nyckeln till borrarkitekturen är DrillBit-servrarna som distribueras på varje datodenod. Observera att varje server innehåller en frågeparser, kompilator, optimeringsprogram och körtid, men det finns en master DrillBit-server som nomineras av Zookeeper-servrar, som övervakar genomförandet av frågorna och ser till att uppgiften är att sammanföra resultatresultaten i en enda uppsättning utgång.
Liksom Dremel kan borr sameksistera med och komplementera MapReduce, men MapReduce används inte för att uppfylla frågor, som med Apache Hive. Istället har exekveringsmotorer som heter Drillbits utvecklats av medlemmar av borrgemenskapen.
Det här samhället syftar till att tillhandahålla låga latensfrågor för applikationer som kontrollpaneler i realtid för affärsunderrättelse, bedrägeribekämpning och andra tidskänsliga användarfall. Drill stöder kapslade datatyper som Avro, JSON och Google protokoll buffertar. Dessa kapslade datatyper möjliggör mycket stora denormaliserade tabeller.
Borrutvecklingsteamet arbetar också med att ge omfattande SQL-support genom att rikta in SQL2003-överensstämmelse. Slutligen notera att borrlaget tillhandahåller HBase-stöd så att användarna kommer att kunna fråga HBase-tabeller med SQL.