Der erste Teil des Buches hat zum Ziel, eine Einführung in die Datenqualitätsanalyse zu geben und die Materie Data Profiling fundiert zu erläutern. Die zweite Hälfte beschäftigt sich mit der Konzeption und prototypischen Implementierung eines Data-Profiling-Werkzeugs auf Grundlage des Eclipse Modeling Frameworks.
Die zentrale funktionale Eigenschaft der Lösung soll ein generiertes grafisches Datenmodell sein, das den Ausgangspunkt für typische Data-Profiling-Funktionen bildet. Aber auch der Entwicklungsprozess soll innovativen Charakter haben. So wird das Domänenmodell der Anwendung mithilfe des Eclipse Modeling Frameworks entworfen und in Programmcode transformiert. Der Diagrameditor wird über das Graphical Modeling Framework von Eclipse modelliert und generiert. Die Data-Profiling-Methoden werden per deskriptiver Schnittstellenerweiterung eingebunden.
Die Lösung, der eher technisch/methodisch orientierten Problemstellung, wird mit den theoretischen Grundlagen der Datenqualität, einer ökonomischen Betrachtung und den potentiellen Anwendungsgebieten eingeleitet. Data-Profiling bildet dann den Schwerpunkt des zweiten Kapitels. Nachdem die Definition aus diversen Literaturquellen hergeleitet ist, wird das Vorgehensmodell dargestellt und die einzelnen Analysemethoden beschrieben und systematisiert.
Anschließend wird die Systemumgebung thematisiert. Das Kapitel ist in eine Beschreibung der Eclipse-Plattform, eine Darstellung des modellbasierten Entwicklungsansatzes mit Eclipse und eine Analyse des Eclipse Modeling Frameworks unterteilt. Als Inspirationsquelle für das Werkzeugkonzept wurde eine Evaluation existierender Data-Profiling-Tools vorgenommen.
Die letzten beiden Kapitel beschäftigen sich mit dem Entwurf und der Implementierung des Data-Profiling-Tools. Dargestellt sind unter andrem die modellgetriebene Entwicklung des Diagrammeditors, die Komponentenarchitektur, Aspekte der Pluginentwicklung unter Eclipse und die Implementierung ausgewählter Data-Profiling-Analysemethoden.
Die zentrale funktionale Eigenschaft der Lösung soll ein generiertes grafisches Datenmodell sein, das den Ausgangspunkt für typische Data-Profiling-Funktionen bildet. Aber auch der Entwicklungsprozess soll innovativen Charakter haben. So wird das Domänenmodell der Anwendung mithilfe des Eclipse Modeling Frameworks entworfen und in Programmcode transformiert. Der Diagrameditor wird über das Graphical Modeling Framework von Eclipse modelliert und generiert. Die Data-Profiling-Methoden werden per deskriptiver Schnittstellenerweiterung eingebunden.
Die Lösung, der eher technisch/methodisch orientierten Problemstellung, wird mit den theoretischen Grundlagen der Datenqualität, einer ökonomischen Betrachtung und den potentiellen Anwendungsgebieten eingeleitet. Data-Profiling bildet dann den Schwerpunkt des zweiten Kapitels. Nachdem die Definition aus diversen Literaturquellen hergeleitet ist, wird das Vorgehensmodell dargestellt und die einzelnen Analysemethoden beschrieben und systematisiert.
Anschließend wird die Systemumgebung thematisiert. Das Kapitel ist in eine Beschreibung der Eclipse-Plattform, eine Darstellung des modellbasierten Entwicklungsansatzes mit Eclipse und eine Analyse des Eclipse Modeling Frameworks unterteilt. Als Inspirationsquelle für das Werkzeugkonzept wurde eine Evaluation existierender Data-Profiling-Tools vorgenommen.
Die letzten beiden Kapitel beschäftigen sich mit dem Entwurf und der Implementierung des Data-Profiling-Tools. Dargestellt sind unter andrem die modellgetriebene Entwicklung des Diagrammeditors, die Komponentenarchitektur, Aspekte der Pluginentwicklung unter Eclipse und die Implementierung ausgewählter Data-Profiling-Analysemethoden.