Análise de dados: Conversão de dados não estruturados em dados estruturados

Broschiertes Buch

A extração e a análise de dados têm recebido recentemente uma atenção significativa devido à evolução das redes sociais e ao grande volume de dados disponíveis de forma não estruturada. O Hadoop e o Map-Reduce têm estado continuamente a implementar e a analisar grandes quantidades de dados. Neste livro, o Apache Pig, que é uma das plataformas de alto nível para a análise de grandes volumes de dados e é executado no topo do Hadoop, é utilizado para analisar ficheiros de registo não estruturados e extrair informações. Neste livro, os ficheiros do servidor de weblog são utilizados para analisar e…mehr