-
Apache HBASE
Apache HBase ™ est une base de données non relationnelle orientée colonnes qui s'exécute au-dessus du système HDFS de Hadoop . C'est un entrepôt Big Data distribué, redimensionnable et évolutif. Il permet un stockage à tolérance de pannes et un accès temps-réel aléatoire à de gros volumes de données distribuées. HBase a été conçues pour accueillir de très larges tables ayant des milliards de lignes et des millions colonnes.
Spark Apache (Framework Big Data)
Apache Spark exécute en une seule fois la totalité des opérations d'analyse de données en mémoire et en quasi-temps réel. Spark peut être jusqu'à 100 plus rapide que MapReduce pour l'analyse en mémoire. C'est la solution de fait pour l'analyse en streaming (capteurs, campagnes de marketing en temps-réel, recommandations, analyse de sentiments, surveillance des logs...)
Apache HADOOP
Apache Hadoop est un framework open source d'Apache Software Foundation qui a rapidement évolué pour devenir la technologie majeure de référence capable de traiter des quantités volumineuses de données structurées mais également non-structurées et complexes. MapReduce, HDSF (système de fichiers distribué de Hadoop) et YARN (gestion de ressources/charges) consituent le noyau de Hadoop.
Apache HIVE
Apache Hive est le standard Haddop en matière de requêtes SQL sur de gros volumes de données pouvant atteindre des péta-octets. Il fournit un ensemble d'outils puissants d’accès aux données Hadoop pour les analystes et les développeurs. Hive facilite l'interrogation et la gestion de grands ensembles de données résidant sur stockage distribué.
Cloudera CHD
Cloudera CDH(Cloudera Distribution Hadoop) est une distrbution totalement Open source sous licence Apache. Intègre des composants de base d'Apache Hadoop qui, couplés à d'autres briques tiers constituent une plateforme unifiée offrant des fonctionnalités de traitement par lots, de requêtes SQL et de recherches interactives, de sécurité avec un contrôle d'accès aux données fonction du profil de l'utilisateur.