Diplomarbeit aus dem Jahr 2001 im Fachbereich Informatik - Wirtschaftsinformatik, Note: 1,3, Rheinisch-Westfälische Technische Hochschule Aachen (Betriebswirtschaftslehre), Sprache: Deutsch, Abstract: Inhaltsangabe:Einleitung:
Data Mining (DM) ist ein Oberbegriff für eine Reihe von Verfahren, die zur automatischen Gewinnung von Informationen aus großen Datenmengen dienen. Genetische Algorithmen (GA) sind Such- und Optimierungsverfahren, die in Analogie zur biologischen Evolution arbeiten und für DM-Aufgaben eingesetzt werden können. Dies geschieht bislang nur sporadisch und an untergeordneter Stelle. Die steigende Verfügbarkeit leistungsstarker Hardware und paralleler Systemarchitekturen machen die Benutzung von GA aber auch für die routinemäßig anfallenden Aufgaben der Datenanalyse immer interessanter.
Das Ziel der Arbeit ist die Untersuchung von GA als Lösungsverfahren für typische DM-Aufgaben der Unternehmenspraxis.
Dazu wird zum einen die prinzipielle Vorgehensweise beim Erfüllen von DM-Aufgaben mit GA diskutiert. Eine Analyse von DM-Aufgaben führt darüber hinaus zu einer Systematisierung in mehrere Aufgaben-Klassen, die sich hinsichtlich ihrer Relevanz für unternehmerische Fragestellungen unterscheiden. Für die wichtigsten dieser Klassen werden konkrete GA-Konfigurationen vorgeschlagen und anschließend anhand von Beispieldaten in mehreren Experimenten erprobt, um auf empirischem Wege Hinweise auf ihre Brauchbarkeit zu gewinnen.
Dem potentiellen Benutzer werden die Potentiale von GA zum DM verdeutlicht und darüber hinaus Hilfestellungen gegeben, die eine praktische Anwendung dieser Methode erleichtern.
Inhaltsverzeichnis:Inhaltsverzeichnis:
1.Einleitung1
1.1Motivation1
1.2Problemstellung2
1.3Gang der Untersuchung2
2.Data Mining - Grundlagen und Methoden3
2.1Formalisierungen3
2.2Begriffsabgrenzung4
2.3Einflussfaktoren für die Methodenwahl6
2.4Unterschiedliche Daten6
2.5Unterschiedliche Ziele7
2.5.1Übersicht7
2.5.2Ableitungsvorschriften8
2.5.3Verknüpfungsregeln10
2.5.4Segmentierung13
2.5.5Datenbeschreibung14
2.6Ausgewählte Verfahren des Data Mining15
2.6.1Übersicht15
2.6.2Market Basket Analysis16
2.6.3Regelinduktion18
2.6.4Case-based Reasoning20
2.6.5Neuronale Netze22
2.6.6Bayes-Netze24
2.6.7Rough Set Theory26
2.6.8Explorative Datenanalyse27
2.7Logische Grenzen der Aussagefähigkeit entdeckter Muster28
3.Genetische Algorithmen30
3.1Überblick30
3.2Parallelen zur Evolutionstheorie32
3.3Problemrepräsentation33
3.3.1Bitkodierung33
3.3.2Andere Kodierungsmöglichkeiten35
3.3.3Suchraum und Fitnesslandschaft36
3.4Populationen38
3.4.1Populationsgröße38
3.4.2Initialisierungsstrategie39
3.4.3Generationsersetzung39
3.4.4Populationsstruktur40
3.5Fitneßfunktion41
3.6Selektion42
3.7Genetische Operatoren43
3.7.1Crossover43
3.7.2Mutation46
3.7.3Parametersetzung48
3.8Abbruchkriterium49
3.9Weitergehende Varianten genetischer Algorithmen49
3.9.1Parallele genetische Algorithmen49
3.9.2Hybride genetische Algorithmen50
3.10Theoretischer Hintergrund51
4.Genetische Algorithmen zur Lösung typischer Data-Mining-Aufgaben54
4.1Gründe für die Benutzung von GA54
4.2Prinzipielle Vorgehensweise55
4.3Systematisierung von DM-Aufgaben58
4.4Konfigurationen für ausgewählte Aufgabenstellungen59
4.4.1Relevante Aufgabenstellungen59
4.4.2Konfigurationsempfehlungen61
4.4.2.1Generelle Überlegungen61
4.4.2.2Konfigurationsempfehlungen für Suchproblem I62
4.4.2.3Konfigurationsempfehlungen für Suchproblem II68
4.4.2.4Konfigurationsempfehlungen für Suchproblem IV69
4.4.2.5Konfigurationsempfehlungen für Suchproblem VII70
4.4.2.6Ko...
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Data Mining (DM) ist ein Oberbegriff für eine Reihe von Verfahren, die zur automatischen Gewinnung von Informationen aus großen Datenmengen dienen. Genetische Algorithmen (GA) sind Such- und Optimierungsverfahren, die in Analogie zur biologischen Evolution arbeiten und für DM-Aufgaben eingesetzt werden können. Dies geschieht bislang nur sporadisch und an untergeordneter Stelle. Die steigende Verfügbarkeit leistungsstarker Hardware und paralleler Systemarchitekturen machen die Benutzung von GA aber auch für die routinemäßig anfallenden Aufgaben der Datenanalyse immer interessanter.
Das Ziel der Arbeit ist die Untersuchung von GA als Lösungsverfahren für typische DM-Aufgaben der Unternehmenspraxis.
Dazu wird zum einen die prinzipielle Vorgehensweise beim Erfüllen von DM-Aufgaben mit GA diskutiert. Eine Analyse von DM-Aufgaben führt darüber hinaus zu einer Systematisierung in mehrere Aufgaben-Klassen, die sich hinsichtlich ihrer Relevanz für unternehmerische Fragestellungen unterscheiden. Für die wichtigsten dieser Klassen werden konkrete GA-Konfigurationen vorgeschlagen und anschließend anhand von Beispieldaten in mehreren Experimenten erprobt, um auf empirischem Wege Hinweise auf ihre Brauchbarkeit zu gewinnen.
Dem potentiellen Benutzer werden die Potentiale von GA zum DM verdeutlicht und darüber hinaus Hilfestellungen gegeben, die eine praktische Anwendung dieser Methode erleichtern.
Inhaltsverzeichnis:Inhaltsverzeichnis:
1.Einleitung1
1.1Motivation1
1.2Problemstellung2
1.3Gang der Untersuchung2
2.Data Mining - Grundlagen und Methoden3
2.1Formalisierungen3
2.2Begriffsabgrenzung4
2.3Einflussfaktoren für die Methodenwahl6
2.4Unterschiedliche Daten6
2.5Unterschiedliche Ziele7
2.5.1Übersicht7
2.5.2Ableitungsvorschriften8
2.5.3Verknüpfungsregeln10
2.5.4Segmentierung13
2.5.5Datenbeschreibung14
2.6Ausgewählte Verfahren des Data Mining15
2.6.1Übersicht15
2.6.2Market Basket Analysis16
2.6.3Regelinduktion18
2.6.4Case-based Reasoning20
2.6.5Neuronale Netze22
2.6.6Bayes-Netze24
2.6.7Rough Set Theory26
2.6.8Explorative Datenanalyse27
2.7Logische Grenzen der Aussagefähigkeit entdeckter Muster28
3.Genetische Algorithmen30
3.1Überblick30
3.2Parallelen zur Evolutionstheorie32
3.3Problemrepräsentation33
3.3.1Bitkodierung33
3.3.2Andere Kodierungsmöglichkeiten35
3.3.3Suchraum und Fitnesslandschaft36
3.4Populationen38
3.4.1Populationsgröße38
3.4.2Initialisierungsstrategie39
3.4.3Generationsersetzung39
3.4.4Populationsstruktur40
3.5Fitneßfunktion41
3.6Selektion42
3.7Genetische Operatoren43
3.7.1Crossover43
3.7.2Mutation46
3.7.3Parametersetzung48
3.8Abbruchkriterium49
3.9Weitergehende Varianten genetischer Algorithmen49
3.9.1Parallele genetische Algorithmen49
3.9.2Hybride genetische Algorithmen50
3.10Theoretischer Hintergrund51
4.Genetische Algorithmen zur Lösung typischer Data-Mining-Aufgaben54
4.1Gründe für die Benutzung von GA54
4.2Prinzipielle Vorgehensweise55
4.3Systematisierung von DM-Aufgaben58
4.4Konfigurationen für ausgewählte Aufgabenstellungen59
4.4.1Relevante Aufgabenstellungen59
4.4.2Konfigurationsempfehlungen61
4.4.2.1Generelle Überlegungen61
4.4.2.2Konfigurationsempfehlungen für Suchproblem I62
4.4.2.3Konfigurationsempfehlungen für Suchproblem II68
4.4.2.4Konfigurationsempfehlungen für Suchproblem IV69
4.4.2.5Konfigurationsempfehlungen für Suchproblem VII70
4.4.2.6Ko...
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.