Apache Hive est une infrastructure d'entrepôt de données intégrée sur Hadoop permettant l'analyse, le requêtage via un langage proche syntaxiquement de SQL ainsi que la synthèse de données appelée le HQL. Le but de ce document est de vous aider à tirer profit de cet outil en gardant en tête quelques aspects clés (format de stockage, les fonctions utilisateurs, l'échantillonnage des données). Ainsi que des exemples de code que vous pourriez réutiliser facilement.