Ultima versiune | 0,20,2 (29 martie 2021) |
---|---|
Versiune avansată | 0.16.0-incubare-rc3 (14 septembrie 2019) |
Depozit | github.com/apache/druid |
Asigurarea calității | Integrare continuă |
Scris in | Java |
Tip | Sistemul de gestionare a bazelor de date |
Licență | Licență Apache versiunea 2.0 |
Site-ul web | druid.io |
Druid este o bază de date distribuită , coloane orientate și open source , scrisă în Java . Druid este conceput pentru a ingera cantități uriașe de date despre evenimente și pentru a returna datele cu o latență scăzută . Numele Druid se referă la druizii multor jocuri de rol , prin analogie cu capacitatea arhitecturii sistemului de a se transforma în rezolvarea diferitelor tipuri de probleme de date.
Druidul este utilizat în mod obișnuit în aplicațiile de business intelligence și de procesare analitică online pentru a analiza volume mari de date istorice și în timp real. Druidul este utilizat în producție de companii de tehnologie precum Alibaba , Airbnb , Cisco , eBay , Netflix , PayPal , Yahoo și Wikimedia Foundation .
Druid a fost lansat în 2011 pentru a alimenta produsul analitic al companiei Metamarkets. Proiectul a fost open source sub licența GPL înoctombrie 2012 și a trecut la o licență Apache în februarie 2015.
De-a lungul timpului, o serie de organizații și companii au integrat Druid în biroul lor de back-office și au fost adăugați angajați din numeroase organizații.
În octombrie 2015, compania comercială Imply a început să ofere un produs comercial construit în jurul Druidului.
În octombrie 2018, Spicule Ltd a lansat o versiune acceptată de Druid pe platforma Juju de la Canonical.
Complet implementat, Druid rulează ca un cluster de procese specializate (numite noduri în Druid) pentru a susține o arhitectură tolerantă la erori , datele sunt stocate redundant și în absența unui singur punct de eșec Clusterul include dependențe externe pentru coordonare ( Apache ZooKeeper ), stocarea metadatelor (de ex. MySQL , PostgreSQL sau Derby ) și o facilitate de stocare profundă (de exemplu HDFS sau Amazon S3 ) pentru backupul permanent al datelor.
Solicitările clienților sunt trimise mai întâi către nodurile brokerilor, care apoi le redirecționează către nodurile corespunzătoare (istorice sau în timp real). Deoarece segmentele druide pot fi partiționate, o cerere primită poate necesita date de la mai multe segmente și partiții stocate pe diferite noduri ale clusterului. Brokerii pot afla care noduri au datele necesare și apoi pot combina rezultatele parțiale înainte de a returna rezultatul agregat.
Operațiunile legate de gestionarea datelor în nodurile istorice sunt supravegheate de noduri de coordonare. Apache ZooKeeper este folosit pentru a înregistra toate nodurile, pentru a gestiona unele aspecte ale comunicațiilor inter-noduri și pentru a organiza alegeri pentru un lider.