Diplomarbeit aus dem Jahr 2002 im Fachbereich Informatik - Wirtschaftsinformatik, Note: 1,3, Hochschule Pforzheim (unbekannt), Sprache: Deutsch, Abstract: Inhaltsangabe:Zusammenfassung:
Für den Einsatz von Data Mining in branchenspezifischen Projektlösungen bietet sich die Einbeziehung von etablierten Schnittstellen-Standards an. Dies ermöglicht einerseits eine dynamisch strukturierte Analyse-Infrastruktur, die je nach Bedarfs- und Marktentwicklung erweitert werden kann und erlaubt andererseits einen schnelleren und effizienteren Einsatz der erstellten Modelle in der operativen Umgebung.
Um die Bedeutung des PMML Standards für Data Mining Lösungen in der nächsten Zukunft einschätzen zu können, ist der Gegenstand der Arbeit die Untersuchung der verschiedenen Aspekte dieser Schnittstelle.
Im zweiten Kapitel erfolgt ein Überblick über die neben PMML existierenden Data Mining Schnittstellen, um diese später (am Ende des dritten Kapitels) mit dem PMML Standard vergleichen zu können. Dabei soll im zweiten Kapitel auf die Entstehung, Zusammenhänge und Komponenten beziehungsweise Bestandteile jedes einzelnen Standards eingegangen werden.
Im dritten Kapitel erfolgt die Evaluierung des PMML Standards. Dies geschieht zunächst anhand der Beschreibung von PMML bezüglich der Struktur und Document Type Definition (DTD). Anschließend werden die in Kapitel zwei betrachteten Schnittstellen mit ihren Besonderheiten zusammengefasst, um sie dann mit PMML vergleichen zu können. Anhand einer SWOT-Analyse werden die Stärken/ Schwächen- beziehungsweise Chancen- und Risiken von PMML erarbeitet und beurteilt. Am Kapitelende erfolgt ein Ausblick bezüglich der Zukunft von PMML.
In Kapitel vier werden mögliche Data Mining Lösungsarchitekturen aufgeführt, um dem Leser den Zusammenhang von Data Mining und Data Warehouse aufzuzeigen und ihn auf die folgenden Kapitel bezüglich des PMML Einsatzes vorzubereiten.
Die Kapitel fünf und sechs stellen den praxisorientierten Teil dar. Dabei werden in Kapitel fünf zunächst die drei für SBS Siemens Business Services interessantesten und auch mächtigsten Data Mining-Tools als PMML Provider ausführlicher betrachtet und bezüglich der Möglichkeiten der PMML Implementierung beurteilt. Folgend werden weitere Data Mining-Tools anhand der entwickelten Kriterien in tabellarischer Form aufgeführt.
Kapitel sechs befasst sich mit den Client-seitigen Einsatzmöglichkeiten von PMML in den Bereichen des Supply Chain Managements (SCM), Customer Relationship Managements (CRM), Electronic Commerce (eCommerce) und in Datenbanken.
Abschließend sollen die wichtigsten Erkenntnisse im Rahmen eines Fazits zusammengefasst werden.
Inhaltsverzeichnis:Inhaltsverzeichnis:
1.Einleitung1
1.1Inhalt und Aufbau dieser Arbeit2
2.Überblick zu existierenden Data Mining Schnittstellen4
2.1Object Linking And Embedding DataBase für Data Mining (OLE DB DM)4
2.1.1Object Linking And Embedding (OLE)5
2.1.2Object Linking AndEmbedding DataBase (OLE DB) und Open Database Connectivity (ODBC)6
2.2Object Management Group's Common Warehouse Metamodel (OMG CWM)7
2.2.1Die Object Management Group (OMG)7
2.2.2Das Common Warehouse Metamodel (CWM)8
2.2.3Das CWM Data Mining Metamodel15
2.3Structured Query Language für Medienobjekte (SQL/ MM Data Mining)19
2.3.1Data Mining Phasen21
2.3.2SQL/ MM Typen am Beispiel von Klassifikation25
2.4Java Data Mining Application Program Interface (JDMAPI)27
2.4.1Java Database Connectivity (JDBC)31
3.Beschreibung von PMML34
3.1Die aktuelle PMML Version36
3.1.1Die allgemeine Struktur eines PMML Dokuments36
3.1.2Die Grundstruktur eines PMML Dokumentes37
3.1.3Das Mining Schema48
3.1.4Grundlegende Datentypen und Entitäten49
3.2Zusammenfassung und Vergleich mit anderen Schnittstellen50
3.3Di...
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Für den Einsatz von Data Mining in branchenspezifischen Projektlösungen bietet sich die Einbeziehung von etablierten Schnittstellen-Standards an. Dies ermöglicht einerseits eine dynamisch strukturierte Analyse-Infrastruktur, die je nach Bedarfs- und Marktentwicklung erweitert werden kann und erlaubt andererseits einen schnelleren und effizienteren Einsatz der erstellten Modelle in der operativen Umgebung.
Um die Bedeutung des PMML Standards für Data Mining Lösungen in der nächsten Zukunft einschätzen zu können, ist der Gegenstand der Arbeit die Untersuchung der verschiedenen Aspekte dieser Schnittstelle.
Im zweiten Kapitel erfolgt ein Überblick über die neben PMML existierenden Data Mining Schnittstellen, um diese später (am Ende des dritten Kapitels) mit dem PMML Standard vergleichen zu können. Dabei soll im zweiten Kapitel auf die Entstehung, Zusammenhänge und Komponenten beziehungsweise Bestandteile jedes einzelnen Standards eingegangen werden.
Im dritten Kapitel erfolgt die Evaluierung des PMML Standards. Dies geschieht zunächst anhand der Beschreibung von PMML bezüglich der Struktur und Document Type Definition (DTD). Anschließend werden die in Kapitel zwei betrachteten Schnittstellen mit ihren Besonderheiten zusammengefasst, um sie dann mit PMML vergleichen zu können. Anhand einer SWOT-Analyse werden die Stärken/ Schwächen- beziehungsweise Chancen- und Risiken von PMML erarbeitet und beurteilt. Am Kapitelende erfolgt ein Ausblick bezüglich der Zukunft von PMML.
In Kapitel vier werden mögliche Data Mining Lösungsarchitekturen aufgeführt, um dem Leser den Zusammenhang von Data Mining und Data Warehouse aufzuzeigen und ihn auf die folgenden Kapitel bezüglich des PMML Einsatzes vorzubereiten.
Die Kapitel fünf und sechs stellen den praxisorientierten Teil dar. Dabei werden in Kapitel fünf zunächst die drei für SBS Siemens Business Services interessantesten und auch mächtigsten Data Mining-Tools als PMML Provider ausführlicher betrachtet und bezüglich der Möglichkeiten der PMML Implementierung beurteilt. Folgend werden weitere Data Mining-Tools anhand der entwickelten Kriterien in tabellarischer Form aufgeführt.
Kapitel sechs befasst sich mit den Client-seitigen Einsatzmöglichkeiten von PMML in den Bereichen des Supply Chain Managements (SCM), Customer Relationship Managements (CRM), Electronic Commerce (eCommerce) und in Datenbanken.
Abschließend sollen die wichtigsten Erkenntnisse im Rahmen eines Fazits zusammengefasst werden.
Inhaltsverzeichnis:Inhaltsverzeichnis:
1.Einleitung1
1.1Inhalt und Aufbau dieser Arbeit2
2.Überblick zu existierenden Data Mining Schnittstellen4
2.1Object Linking And Embedding DataBase für Data Mining (OLE DB DM)4
2.1.1Object Linking And Embedding (OLE)5
2.1.2Object Linking AndEmbedding DataBase (OLE DB) und Open Database Connectivity (ODBC)6
2.2Object Management Group's Common Warehouse Metamodel (OMG CWM)7
2.2.1Die Object Management Group (OMG)7
2.2.2Das Common Warehouse Metamodel (CWM)8
2.2.3Das CWM Data Mining Metamodel15
2.3Structured Query Language für Medienobjekte (SQL/ MM Data Mining)19
2.3.1Data Mining Phasen21
2.3.2SQL/ MM Typen am Beispiel von Klassifikation25
2.4Java Data Mining Application Program Interface (JDMAPI)27
2.4.1Java Database Connectivity (JDBC)31
3.Beschreibung von PMML34
3.1Die aktuelle PMML Version36
3.1.1Die allgemeine Struktur eines PMML Dokuments36
3.1.2Die Grundstruktur eines PMML Dokumentes37
3.1.3Das Mining Schema48
3.1.4Grundlegende Datentypen und Entitäten49
3.2Zusammenfassung und Vergleich mit anderen Schnittstellen50
3.3Di...
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.