Apache Hive è un'infrastruttura di data warehouse integrata in Hadoop che consente l'analisi, l'interrogazione tramite un linguaggio sintatticamente vicino a SQL e la sintesi dei dati chiamato HQL. L'obiettivo di questo documento è quello di aiutarvi a trarre vantaggio da questo strumento tenendo conto di alcuni aspetti chiave (formato di memorizzazione, funzioni utente, campionamento dei dati).