Apache Hive é uma infra-estrutura de armazenamento de dados integrada no Hadoop que permite a análise, a consulta através de uma linguagem sintáctica próxima de SQL e a síntese de dados chamada HQL. O objectivo deste documento é ajudá-lo a tirar partido desta ferramenta, tendo em mente alguns aspectos chave (formato de armazenamento, funções do utilizador, amostragem de dados).