Diplomarbeit aus dem Jahr 2002 im Fachbereich BWL - Sonstiges, Note: 2,3, Technische Universität Dortmund (Lehrstuhl für Computergestützte Statistik), Sprache: Deutsch, Abstract: Boosting (englisch: "verstärken, fördern") ist eine generelle Methode, um die Genauigkeit eines gegebenen Lern- oder Klassifikationsalgorithmus zu erhöhen. Ein sogenannter "schwacher" Lernalgorithmus, der kaum besser und genauer ist als einfaches Raten, wird soweit "verstärkt", das sich ein ziemlich genauer "starker" Lernalgorithmus ergibt. Dabei werden während des wiederholten Durchlaufens des Boostingalgorithmus durch unterschiedliche Gewichtung der Trainingsbeispiele mehrere Klassifikatoren berechnet, deren Linearkombination dann einen verbesserten Klassifikator liefert.Die Wurzeln und die Enstehungsgeschichte von Boosting finden ebenso Beachtung wie ein Darstellung gängiger Boostingalgorithmen.Einer der Repräsentanten dieser Algorithmenklasse - MART - wird auf den RWI-Datensatz des Rheinisch-Westfälische Institut für Wirtschaftsforschung (RWI) in Essen angewandt, dessen besondere Bedeutung vor dem Hintergrund des Sonderforschungsbereichs 475 Komplexitätsreduktion in multivariaten Datenstrukturen beleuchtet wird.Mittels einer doppelten leave-one-Cycle-out-Analyse werden die Analyseergebnisse mit denen des CART-Algorithmus verglichen.Das statistische Problem der Klassifikation beschäftigt sich mit der Zuordnung von Objekten zu Klassen. Jedes Objekt ist charakterisiert durch eine Anzahl von Variablenausprägungen und soll eindeutig in eine Klasse eingeordnet werden. Ein Klassifikationsalgorithmus oder Klassifikator trainiert zunächst auf einer Menge von bereits klassifizierten Objekten. Dann ordnet er Objekte, von denen nur die Variablenausprägungen, aber nicht die Klassenzugehörigkeiten bekannt sind, einer Klasse zu. Diese grundlegenden Begriffe der Klassifikation werden zusammen mit dem CART-Algorithmus, dem PAC-Lern-Modell und den Überlegungen über die Einbeziehung von Hintergrundwissen in Klassifikationsalgorithmen erläutert.Boosting ist ein interessantes Konzept zur Verbesserung von Klassifikatoren. Es wird nicht nur in der Statistik eingesetzt, sondern hat Anwendungen in der Mustererkennung, der Spieltheorie und der Texterkennung gefunden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.