Dezvoltat de | Apache Software Foundation |
---|---|
Prima versiune | 4 ianuarie 2015 |
Ultima versiune | 1.18.0 (5 septembrie 2020) |
Depozit | github.com/apache/drill și git: //git.apache.org/drill.git |
Starea proiectului | Dezvoltare |
Scris in | Java |
Licență | Licență Apache |
Site-ul web | drill.apache.org |
Apache Drill este un cadru software open-source care acceptă aplicații distribuite în timp real pentru analiza interactivă a seturilor de date la scară largă. Drill este versiunea open source a sistemului Dremel de la Google, care este disponibil ca serviciu de infrastructură numit Google BigQuery. Un obiectiv de proiectare afirmă în mod explicit că Drill este capabil să se redimensioneze la 10.000 sau mai multe servere și să poată procesa petabytes de date și miliarde de înregistrări în câteva secunde. Drill este un proiect de nivel superior pentru Apache.
Drill acceptă multe baze de date NoSQL și multe sisteme de fișiere precum HBase , MongoDB , MapR-DB, HDFS , MapR-FS, Amazon S3 , Azure Blob Storage, Google Cloud Storage, Swift, NAS și fișiere locale. O singură interogare poate alătura date din depozite de date separate. De exemplu, puteți atașa profilul de utilizator prezent într-o colecție pe MongoDB cu jurnalele Hadoop .
Drill Optimizer restructurează automat un plan de execuție a interogării pentru a profita de capacitățile de procesare ale depozitelor de date interne. În plus, Drill acceptă localitatea datelor, deci este interesant să colocați Drill și un depozit de date pe mai multe noduri.
Drill se concentrează în principal pe stocuri de date non-relaționale, cum ar fi Hadoop, NoSQL și stocarea în cloud. În prezent sunt acceptate următoarele magazine de date:
Noi date pot fi dezvoltate sub formă de pluginuri. Drill folosește un singur model de date JSON care îi permite să interogheze stocuri de date non-relaționale in situ (Multe dintre aceste sisteme de stocare sunt complexe sau fără schemă).
Unele publicații au influențat nașterea și concepția. Iată o listă parțială: