Diplomarbeit aus dem Jahr 2010 im Fachbereich Informatik - Wirtschaftsinformatik, Universität Siegen, Sprache: Deutsch, Abstract: Die Ähnlichkeitensuche gewinnt mit zunehmender Komplexit¨at der Dokumente an Bedeutung. Während existierende Ansätze den inhaltlichen Aspekt der Suche in den Fokus der Betrachtung setzten, wird die strukturelle Ähnlichkeit weitestgehend außen vor gelassen. Im Rahmen dieser Diplomarbeit wird ein einheitlicher Ansatz für die Ähnlichkeitensuche vorgestellt, welcher die strukturellen Aspekte der Zusammensetzung der komplexen Datentypen ebenfalls berücksichtigt und separat als strukturelle Ähnlichkeit ausweist. Die Berechnung der inhaltlichen Ähnlichkeit erlaubt die Erkennung ähnlicher Teilbäume innerhalb beliebiger komplexer Datentypen. Die Daten werden dem System im XML-Dokument- Format übergeben. Diese werden vom System so weit abstrahiert, dass keine Unterschiede aufgrund verschiedener stilistischer Möglichkeiten der Serialisierung von komplexen Datentypen in das XML-Dokument-Format Auswirkungen auf den inhaltlichen Vergleich nehmen können. Dies ermöglicht den Vergleich komplexer Datentypen hinsichtlich ihres Aufbaus und ihres Inhalts.