Hadoop ist ein Framework
Im Kern ist Hadoop ein Framework, mit dessen Hilfe Anwender rechenintensive Prozesse mit großen Datenmengen auf Server-Clustern abarbeiten können. Dieses Framework ist in Java programmiert und ein Top-Level-Projekt der Apache Software Foundation, wird also mit einer so genannten Open-Source-Lizenz vertrieben.
Mit dieser Lizenz dürfen Anwender die Software frei verwenden, modifizieren und verteilen. Zudem ist erlaubt, unter der Apache-Lizenz verfügbare Software in eigenen Softwareprodukten zu verwenden. Diese eigenen Produkte müssen nicht unter einer Apache-Lizenz verfügbar sein. Das führt dazu, dass es eine Reihe von Anbietern gibt, die „Hadoop-Lösungen“ vertreiben, darunter Cloudera, Datameer, Hortonworks, IBM oder Microsoft mit HDInsight.
Mit Hadoop erstellte Applikationen können komplexe Berechnungen auf tausende von Rechnerknoten verteilen und Petabyte an Daten verarbeiten. Mit jeder Suchanfrage, die Anwender im Internet stellen, wird der Beweis für die Leistungsfähigkeit von Hadoop erbracht.