Parchet Apache

Parchet Apache

informație
Dezvoltat de Apache Software Foundation
Prima versiune 13 mai 2015
Depozit git-wip-us.apache.org/repos/asf/parquet-mr.git
Scris in Java
Tip Format fișier ( ro )
Format serializare date ( d )
Proiectul Apache Foundation ( d )
Licență Licență Apache versiunea 2.0
Site-ul web parquet.apache.org și parquet.apache.org

Parchet Apache Caracteristici
Extensie .parquet
Dezvoltat de Apache Software Foundation
Versiune inițială 13 martie 2013
Site-uri web parquet.apache.org
parquet.apache.org

Parchetul Apache este un format orientat pe coloane pentru ecosistemul Apache Hadoop . Este similar cu celelalte formate de fișiere de stocare în coloane disponibile în Hadoop și anume RCFile și RCFile Optimizat. Este compatibil cu majoritatea cadrelor de procesare a datelor din mediul Hadoop. Oferă scheme eficiente de compresie și codificare a datelor cu performanțe îmbunătățite pentru a gestiona datele complexe în bloc. Proiectul open source care a dus la Apache Parquet provine din eforturile comune dintre Twitter și Cloudera . Prima versiune a Apache Parquet 1.0 este lansată îniulie 2013. De cand27 aprilie 2015Apache Parquet devine un proiect de nivel superior al Apache Software Foundation


Articole similare

Note și referințe

  1. „  https://projects.apache.org/json/projects/parquet.json  ” (Accesat la 8 aprilie 2020 )
  2. „  Announcing Parquet 1.0: Columnar Storage for Hadoop  ” , pe twitter.com (accesat la 13 septembrie 2020 ) .
  3. (în) „  Cloudera Blog -  ” pe Cloudera Blog (accesat la 13 septembrie 2020 ) .
  4. (ro) „  Apache Parquet deschide calea pentru o mai bună stocare a datelor Hadoop  ” pe InfoWorld (accesat la 13 septembrie 2020 ) .
  5. https://blogs.apache.org/foundation/entry/the_apache_software_foundation_announces75