A extração e a análise de dados têm recebido recentemente uma atenção significativa devido à evolução das redes sociais e ao grande volume de dados disponíveis de forma não estruturada. O Hadoop e o Map-Reduce têm estado continuamente a implementar e a analisar grandes quantidades de dados. Neste livro, o Apache Pig, que é uma das plataformas de alto nível para a análise de grandes volumes de dados e é executado no topo do Hadoop, é utilizado para analisar ficheiros de registo não estruturados e extrair informações. Neste livro, os ficheiros do servidor de weblog são utilizados para analisar e extrair informações significativas de uma forma não estruturada para uma forma estruturada na estrutura do Apache Pig. Iremos medir a eficiência e o desempenho quando um grande volume de dados é processado no modo Map-Reduce e no modo local.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno