Inhaltsangabe:Zusammenfassung: In dieser Arbeit stehen neben dem Begriff des ¿Data Mining¿ besonders die statistischen Methoden im Mittelpunkt. Interessenten sollen den kreativen Prozess des Data Mining näher kennen lernen und erfahren, welche Rolle dabei der Statistik zukommt. Das Ziel der Arbeit ist, eine weiterreichende Darstellung des Prozesses des Data Mining mit statistischen Methoden zu erstellen, angefangen bei der Zielfindung, über die Modellbildung, bis hin zur Bewertung der Ergebnisse. Dabei orientiert sich die Vorgehensweise der systematischen Auswertung an der Methode des CRoss Industry Standard Process for Data Mining, mit der sich Data Mining Prozesse beschreiben lassen. Zum besseren Verständnis werden grundlegende Begriffe zum Data Mining sowie die bedeutsamsten Methoden und Verfahren zur statistischen Datenanalyse erläutert, welche bei den im Anschluss aufgezeigten Data Mining Problemen zur Anwendung kommen. Die veranschaulichten Analyseprobleme entsprechen den Aufgaben der Data Mining Cups der Jahre 2001 und 2002. Dabei werden die zur Lösung angewendeten statistischen Methoden nachvollziehbar wiedergegeben und es wird auf die kritischen Erfolgsfaktoren eingegangen. Oftmals wirken sich schon einzelne Teilentscheidungen bei der Datenaufbereitung und bei den eingesetzten Klassifizierungsmethoden auf die Lösung der Data Mining Aufgabe aus. Daher stellte sich die Frage, wie solche Abweichungen von den aufgezeigten Methoden aussehen könnten. In dieser Arbeit werden im Einzelnen verschiedene Abwandlungen durchgeführt, am Ende zusammengefasst und diskutiert. Inhaltsverzeichnis:Inhaltsverzeichnis: Abbildungsverzeichnis6 Tabellenverzeichnis7 1.Einleitung9 1.1Problemstellung10 1.2Ziel der Arbeit11 1.3Themenabgrenzung12 2.Der Data Mining Prozess im CRISP-DM Referenzmodell14 2.1Das CRISP-DM Referenzmodell14 2.2Die Phasen des CRISP-DM Referenzmodells15 2.2.1business understanding (Anwendungsverstehen)15 2.2.2data understanding (Datenverstehen)16 2.2.3data preparation (Datenaufbereitung)16 2.2.4modeling (Modellerstellung)17 2.2.5evaluation (Bewertung der Ergebnisse)18 2.2.6deployment (Anwendung)19 3.Grundlegende Begriffe20 3.1Die Statistik im Data Mining Prozess20 3.2Segmentierung und Klassifikation22 3.2.1Begriff der Segmentierung22 3.2.2Begriff der Klassifikation22 3.3Standardisierung23 3.4Maße für die Ähnlichkeit von Objekten24 4.Methoden der statistischen [...]
Dieser Download kann aus rechtlichen Gründen nur mit Rechnungsadresse in A, B, BG, CY, CZ, D, DK, EW, E, FIN, F, GR, HR, H, IRL, I, LT, L, LR, M, NL, PL, P, R, S, SLO, SK ausgeliefert werden.