Diplomarbeit aus dem Jahr 2000 im Fachbereich Informatik - Wirtschaftsinformatik, Note: 1,3, Universität Hamburg (Informatik), Sprache: Deutsch, Abstract: Inhaltsangabe:Zusammenfassung:
Aufgabe der Arbeit ist es gewesen, ein Verfahren und damit ein Programm zu entwickeln, mit dem der Vergleich sogenannter semistrukturierter Daten möglich ist. Semistrukturierte Daten sind Bäume, deren Knoten als unstrukturiert aufgefasst werden. XML-Dokumente stellen ein gutes Beispiel für derartige Dokumente dar.
Diese Arbeit zeigt, wie XML-Dokumente mit Hilfe von JAVA gelesen, aufbereitet und mit anderen XML-Dokumenten so verglichen werden können, dass die Unterschiede in Form eines edit-scripts dargestellt werden. Ein edit-script stellt eine Folge elementarer Änderungsoperationen dar, mit deren Hilfe das eine Dokument sukzessive verändert werden kann, bis es dem anderen entspricht. Somit stellt ein edit-script die Differenz zweier XML-Dokumente dar. Dabei werden nicht nur das Einfügen, Entfernen und Verändern einzelner Knoten (inklusive deren Unterknoten) berücksichtigt, sondern auch das Verschieben und Kopieren.
Es werden unterschiedliche Verfahren vorgestellt, mit deren Hilfe Dokumente unterschiedlicher Struktur verglichen werden können. Aus diesen wird ein eigenes Verfahren entwickelt, mit dem der Vergleich semistrukturierter Bäume vollzogen werden kann. Das entwickelte Verfahren wurde mit Hilfe eines im Rahmen der Arbeit erstellten Visualisierungsprogramms überprüft und veranschaulicht.
Inhaltsverzeichnis:Inhaltsverzeichnis:
1.Einleitung1
1.1.Motivation2
1.2.Aufgabenstellung2
1.2.1.Ziel der Arbeit3
1.2.2.Anwendungsgebiete des Dienstes3
1.3.Struktur der Arbeit4
2.Charakteristika des Change Managements5
2.1.Definition des Change Managements5
2.2.Anforderungen an ein Change Management System6
2.3.Kriterienkatalog8
3.Klassifizierung existierender Werkzeuge und Dienste10
3.1.Untersuchte Medien10
3.2.Grad der Berücksichtigung der jeweiligen Dokumentenstruktur12
3.3.Differenziertheit in Bezug auf die Auswertung12
3.4.Art des Dienstes13
4.Existierende Algorithmen zum Change Management15
4.1.Methoden zur Repräsentation von Differenzen15
4.2.Vergleich von Sequenzen18
4.3.Vergleich von Bäumen20
4.3.1.Vergleich geordneter Bäume21
4.3.2.Vergleich ungeordneter Bäume25
4.4.Überblick der Verfahren35
5.Verwendete Entwicklungsumgebung und Sprachen38
5.1.JAVA38
5.2.XML39
5.3.UML39
5.4.Entwurfsmuster40
6.Entwicklung Generischer Dienste für das Change Management42
6.1.Ablauf des Verfahrens42
6.2.Modell und Annahmen des realisierten Ansatzes44
6.3.Das Operationen-Repertoire44
6.4.Repräsentation relevanter Information49
6.4.1.Repräsentation der Änderungen49
6.4.2.Repräsentation der Metadaten51
6.5.Verwendete Algorithmen52
6.5.1.Erzeugung des induzierten Graphen und Bildung der Kantengewichte52
6.5.2.Beschriftung der Kanten61
6.5.3.Ermittlung des edit-scripts66
6.5.4.Betrachtungen zur Zeitabschätzung73
7.Ausgewählte Aspekte der Realisierung75
7.1.Grobarchitektur75
7.2.Ereignisgesteuerte Verarbeitung von XML-Dokumenten76
7.3.Repräsentation und Bearbeitung bipartiter Graphen78
7.4.Austauschbare Algorithmen zum Baumvergleich80
7.5.Generierung des edit-scripts81
7.6.Hindernisse und Richtlinien82
7.7.Visualisierung83
7.8.Konfiguration des Dienstes88
8.Zusammenfassung und Ausblick90
8.1.Bewertung des entwickelten Systems91
8.2.Ausblick92
8.2.1.Weiterführende Arbeiten92
8.2.2.Erweiterungen92
9.Anhang94
9.1.A Planarisierungsproblem in bipartiten Graphen94
9.2.B DTD des edit-scripts und edit-script-Beispiele in XML96
9.2.1.DTD des edit-scripts96
9....
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Aufgabe der Arbeit ist es gewesen, ein Verfahren und damit ein Programm zu entwickeln, mit dem der Vergleich sogenannter semistrukturierter Daten möglich ist. Semistrukturierte Daten sind Bäume, deren Knoten als unstrukturiert aufgefasst werden. XML-Dokumente stellen ein gutes Beispiel für derartige Dokumente dar.
Diese Arbeit zeigt, wie XML-Dokumente mit Hilfe von JAVA gelesen, aufbereitet und mit anderen XML-Dokumenten so verglichen werden können, dass die Unterschiede in Form eines edit-scripts dargestellt werden. Ein edit-script stellt eine Folge elementarer Änderungsoperationen dar, mit deren Hilfe das eine Dokument sukzessive verändert werden kann, bis es dem anderen entspricht. Somit stellt ein edit-script die Differenz zweier XML-Dokumente dar. Dabei werden nicht nur das Einfügen, Entfernen und Verändern einzelner Knoten (inklusive deren Unterknoten) berücksichtigt, sondern auch das Verschieben und Kopieren.
Es werden unterschiedliche Verfahren vorgestellt, mit deren Hilfe Dokumente unterschiedlicher Struktur verglichen werden können. Aus diesen wird ein eigenes Verfahren entwickelt, mit dem der Vergleich semistrukturierter Bäume vollzogen werden kann. Das entwickelte Verfahren wurde mit Hilfe eines im Rahmen der Arbeit erstellten Visualisierungsprogramms überprüft und veranschaulicht.
Inhaltsverzeichnis:Inhaltsverzeichnis:
1.Einleitung1
1.1.Motivation2
1.2.Aufgabenstellung2
1.2.1.Ziel der Arbeit3
1.2.2.Anwendungsgebiete des Dienstes3
1.3.Struktur der Arbeit4
2.Charakteristika des Change Managements5
2.1.Definition des Change Managements5
2.2.Anforderungen an ein Change Management System6
2.3.Kriterienkatalog8
3.Klassifizierung existierender Werkzeuge und Dienste10
3.1.Untersuchte Medien10
3.2.Grad der Berücksichtigung der jeweiligen Dokumentenstruktur12
3.3.Differenziertheit in Bezug auf die Auswertung12
3.4.Art des Dienstes13
4.Existierende Algorithmen zum Change Management15
4.1.Methoden zur Repräsentation von Differenzen15
4.2.Vergleich von Sequenzen18
4.3.Vergleich von Bäumen20
4.3.1.Vergleich geordneter Bäume21
4.3.2.Vergleich ungeordneter Bäume25
4.4.Überblick der Verfahren35
5.Verwendete Entwicklungsumgebung und Sprachen38
5.1.JAVA38
5.2.XML39
5.3.UML39
5.4.Entwurfsmuster40
6.Entwicklung Generischer Dienste für das Change Management42
6.1.Ablauf des Verfahrens42
6.2.Modell und Annahmen des realisierten Ansatzes44
6.3.Das Operationen-Repertoire44
6.4.Repräsentation relevanter Information49
6.4.1.Repräsentation der Änderungen49
6.4.2.Repräsentation der Metadaten51
6.5.Verwendete Algorithmen52
6.5.1.Erzeugung des induzierten Graphen und Bildung der Kantengewichte52
6.5.2.Beschriftung der Kanten61
6.5.3.Ermittlung des edit-scripts66
6.5.4.Betrachtungen zur Zeitabschätzung73
7.Ausgewählte Aspekte der Realisierung75
7.1.Grobarchitektur75
7.2.Ereignisgesteuerte Verarbeitung von XML-Dokumenten76
7.3.Repräsentation und Bearbeitung bipartiter Graphen78
7.4.Austauschbare Algorithmen zum Baumvergleich80
7.5.Generierung des edit-scripts81
7.6.Hindernisse und Richtlinien82
7.7.Visualisierung83
7.8.Konfiguration des Dienstes88
8.Zusammenfassung und Ausblick90
8.1.Bewertung des entwickelten Systems91
8.2.Ausblick92
8.2.1.Weiterführende Arbeiten92
8.2.2.Erweiterungen92
9.Anhang94
9.1.A Planarisierungsproblem in bipartiten Graphen94
9.2.B DTD des edit-scripts und edit-script-Beispiele in XML96
9.2.1.DTD des edit-scripts96
9....
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.