Hadoop ist eine freies, Java-basiertes Open Source Framework für die verteilte Verarbeitung großer Datenmengen innerhalb eines Netzwerks. Mittlerweile ist Hadoop bei vielen namhaften Firmen im Einsatz, die naturgemäß viele Petabyte an Daten zu verarbeiten haben, wie z.B. Facebook, Yahoo!, Twitter, Apple, IBM oder Amazon. Dieses Buch richtet sich an alle, die praktisch wie akademisch am Thema Big Data interessiert sind. Da Hadoop in weiten Teilen auf Java von Oracle (vormals Sun Microsystems) basiert, ist für einen tieferen Einstieg solides Grundwissen in dieser Programmiersprache nützlich.Neben administrativen Themen wie Installation, Konfiguration und Einsatz von Hadoop werden viele praktische Beispiele ausgeführt, die Ihnen die Entwicklung von MapReduce-basierten Anwendungen Schritt für Schritt erläutern. Dabei erhalten Sie sowohl Einblick in den Einsatz geeigneter Werkzeuge als auch Tipps für die Fehlersuche und die Optimierung von MapReduce-Jobs. Ein eigenes Kapitel über das "Ökosystem" von Hadoop mit der Beschreibung vieler Anwendungen und ein Kapitel über dessen Praxiseinsatz im deutschsprachigen Raum runden das Buch ab.