Diplomarbeit aus dem Jahr 2001 im Fachbereich Informatik - Angewandte Informatik, Note: 1,7, Technische Universität Dortmund (unbekannt), Sprache: Deutsch, Abstract: Inhaltsangabe:Zusammenfassung:
In den letzten zehn Jahren ist die Menge der weltweit gesammelten und gespeicherten Daten immens angestiegen. Diese Daten können nur dann sinnvoll genutzt werden, wenn die Nutzenden wissen, wo und wie sie die Daten finden, was die Daten beinhalten und wie die Daten verwendet werden können. Im Verlauf der industriellen Auftragsabwicklung ist es z.B. notwendig, existierende Materialstammdaten schnellstmöglich wiederzufinden. Die Einordnung der Materialstammdaten in das Fachgebiet der Produktionsplanung und steuerung verdeutlicht die Problematik. Dieser Zustand macht eine Datenauswertung mit traditionellen Mitteln unmöglich. Daher ist der Wunsch nach Verfahren entstanden, die automatisch interessante Muster aus großen Datenbeständen filtern. Aus dieser Zielsetzung ist das Forschungsgebiet des Knowledge Discovery in Databases (KDD) Anfang der 90er Jahre entstanden. Mit Hilfe eigener Methoden werden Abhängigkeiten und Regelmäßigkeiten zwischen Datenbankeinträgen und Dokumenten gefunden. Anschließend wird das gefundene Wissen in einer für den Menschen verständlichen Form präsentiert. In diesem Zusammenhang stellt ein von der SAP AG neu entwickeltes Tool eine Lösungsmöglichkeit für das Materialstammdatenmanagement dar. Dazu wird in der vorliegenden Arbeit das Thema KDD unter ausgewählten Aspekten analysiert. Das neuartige Tool soll in den KDD Prozeß integriert werden. Anschließend werden die einzelnen Schritte des KDD Prozeß für die Materialstammdaten diskutiert. Insgesamt wird ein Verfahren zur Wiederverwendung von Materialstammdaten mit Hilfe eines neuartigen Tool unter Verwendung von Methoden des KDD entworfen.
Einleitung:
Data Mining und Knowledge Discovery in Datenbanken (KDD) erhalten zunehmende Beachtung in der Forschung, in der Industrie und in den Medien. In den letzten Jahren wurden die Fähigkeiten, immense Mengen an Daten zu produzieren und zu sammeln enorm verstärkt. Die Anzahl und die Größe der genutzten Datenbanken im Handel, in der öffentlichen Verwaltung, in der Wissenschaft, in der Produktion und anderen Bereichen wächst stetig. Die gleiche Entwicklung ist für den Bereich der EDV-Anwendungen zu beobachten. Mit der zunehmenden Vernetzung der Unternehmen steigt im industriellen Bereich demnach die Anzahl der internen und externen Datenquellen. Diese Informationsflut hat zur Folge, daß in den Unternehmen ein großer Teil der Arbeitszeit mit der Erstellung, Änderung, Ablage und Weiterleitung von Informationen verbracht wird.
Weiterhin gewinnen Informationen sowohl als wichtiger Produktionsfaktor im operativen Betrieb als auch in strategischen Entscheidungsprozessen an Bedeutung. Dieser Zustand läßt die dringende Notwendigkeit entstehen, eine neue Generation computergestützter Theorien und Tools zu entwickeln. Diese Hilfsmittel und Methoden sollen den Menschen bei der Entdeckung nützlicher Informationen aus dem schnell wachsenden Bestand gespeicherter Daten unterstützen.
Problemstellung
Elektronische Informations- und Speichermedien verbreiten sich nach Küppers zunehmend. Die Menge der Daten, die prinzipiell digital zur Verfügung stehen, wächst immer schneller an. Bereits die existierende Menge der Daten im wissenschaftlichen und betrieblichen Bereich verhindert häufig eine Auswertung mit traditionellen Mitteln. Die US-amerikanische Warenhauskette Wal-Mart ist z. B. mit mehr als 2.000 Geschäften eines der größten Einzelhandelsunternehmen weltweit. Dort werden täglich bis zu 20 Millionen Transaktionen gespeichert. Dieses Beispiel weist bereits auf das Problem der Redundanzen und Inkonsistenzen in gegenwärtig genutzten integrierten Systemen hin. Ursache für diesen Zustand sind u.a. Bedienerfehler und unzulänglich geprüfte...
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
In den letzten zehn Jahren ist die Menge der weltweit gesammelten und gespeicherten Daten immens angestiegen. Diese Daten können nur dann sinnvoll genutzt werden, wenn die Nutzenden wissen, wo und wie sie die Daten finden, was die Daten beinhalten und wie die Daten verwendet werden können. Im Verlauf der industriellen Auftragsabwicklung ist es z.B. notwendig, existierende Materialstammdaten schnellstmöglich wiederzufinden. Die Einordnung der Materialstammdaten in das Fachgebiet der Produktionsplanung und steuerung verdeutlicht die Problematik. Dieser Zustand macht eine Datenauswertung mit traditionellen Mitteln unmöglich. Daher ist der Wunsch nach Verfahren entstanden, die automatisch interessante Muster aus großen Datenbeständen filtern. Aus dieser Zielsetzung ist das Forschungsgebiet des Knowledge Discovery in Databases (KDD) Anfang der 90er Jahre entstanden. Mit Hilfe eigener Methoden werden Abhängigkeiten und Regelmäßigkeiten zwischen Datenbankeinträgen und Dokumenten gefunden. Anschließend wird das gefundene Wissen in einer für den Menschen verständlichen Form präsentiert. In diesem Zusammenhang stellt ein von der SAP AG neu entwickeltes Tool eine Lösungsmöglichkeit für das Materialstammdatenmanagement dar. Dazu wird in der vorliegenden Arbeit das Thema KDD unter ausgewählten Aspekten analysiert. Das neuartige Tool soll in den KDD Prozeß integriert werden. Anschließend werden die einzelnen Schritte des KDD Prozeß für die Materialstammdaten diskutiert. Insgesamt wird ein Verfahren zur Wiederverwendung von Materialstammdaten mit Hilfe eines neuartigen Tool unter Verwendung von Methoden des KDD entworfen.
Einleitung:
Data Mining und Knowledge Discovery in Datenbanken (KDD) erhalten zunehmende Beachtung in der Forschung, in der Industrie und in den Medien. In den letzten Jahren wurden die Fähigkeiten, immense Mengen an Daten zu produzieren und zu sammeln enorm verstärkt. Die Anzahl und die Größe der genutzten Datenbanken im Handel, in der öffentlichen Verwaltung, in der Wissenschaft, in der Produktion und anderen Bereichen wächst stetig. Die gleiche Entwicklung ist für den Bereich der EDV-Anwendungen zu beobachten. Mit der zunehmenden Vernetzung der Unternehmen steigt im industriellen Bereich demnach die Anzahl der internen und externen Datenquellen. Diese Informationsflut hat zur Folge, daß in den Unternehmen ein großer Teil der Arbeitszeit mit der Erstellung, Änderung, Ablage und Weiterleitung von Informationen verbracht wird.
Weiterhin gewinnen Informationen sowohl als wichtiger Produktionsfaktor im operativen Betrieb als auch in strategischen Entscheidungsprozessen an Bedeutung. Dieser Zustand läßt die dringende Notwendigkeit entstehen, eine neue Generation computergestützter Theorien und Tools zu entwickeln. Diese Hilfsmittel und Methoden sollen den Menschen bei der Entdeckung nützlicher Informationen aus dem schnell wachsenden Bestand gespeicherter Daten unterstützen.
Problemstellung
Elektronische Informations- und Speichermedien verbreiten sich nach Küppers zunehmend. Die Menge der Daten, die prinzipiell digital zur Verfügung stehen, wächst immer schneller an. Bereits die existierende Menge der Daten im wissenschaftlichen und betrieblichen Bereich verhindert häufig eine Auswertung mit traditionellen Mitteln. Die US-amerikanische Warenhauskette Wal-Mart ist z. B. mit mehr als 2.000 Geschäften eines der größten Einzelhandelsunternehmen weltweit. Dort werden täglich bis zu 20 Millionen Transaktionen gespeichert. Dieses Beispiel weist bereits auf das Problem der Redundanzen und Inkonsistenzen in gegenwärtig genutzten integrierten Systemen hin. Ursache für diesen Zustand sind u.a. Bedienerfehler und unzulänglich geprüfte...
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.