Studienarbeit aus dem Jahr 2004 im Fachbereich BWL - Marketing, Unternehmenskommunikation, CRM, Marktforschung, Social Media, Note: 1,7, Freie Universität Berlin (Marketing-Department), 17 Quellen im Literaturverzeichnis, Sprache: Deutsch, Anmerkungen: Diese Arbeit beschreibt die Arten von fehlenden Werten (i.S.v. Missing Data), beleuchtet die Lösungsmöglichkeiten und gibt praktische Handlungsempfehlungen für den Umgang. Beim Vorkommen fehlender Werte muss man zunächst Klarheit über die Struktur des Ausfalls gewinnen, um die richtige Lösung, bzw. Korrektur anzuwenden. Man muss prüfen, ob der Ausfallmechanismus zufällig oder systematisch ist. Ein Ignorieren dieses Problems oder die Benutzung einer Ad-hoc-Lösung kann das Ergebnis verzerren. , Abstract: Die Marktforschung versucht das Entscheidungsproblem des Managements mit den ihr
verfügbaren Instrumenten zu lösen und dabei möglichst vollständige Datensätze aus
Primärforschung oder Deskresearch zu verwenden. Dies ist jedoch häufigunmöglich,
auch wenn dasjenige Untersuchungsdesign verwendet wird, bei dem wenige Ausfälle
vermutet werden. Bei der Auswahl des entsprechenden Erhebungsdesigns sollte man sich
im Klaren über mögliche Ausfallursachen sein (Herrmann/Homburg, 2000, S.81ff). So
kann in einem Interview falsches Verständnis der Frage, die Auskunftsunfähigkeit oder der
Unwille zur Beantwortung der Frage zu fehlenden Werten führen. Vor allem Fragen zu
Einkommen, Sexualverhalten oder Alkoholkonsum werden oft nicht beantwortet. So gibt
es viele Datensätze in der Marktforschung, die unvollständig sind: In einem Panel von
Horowitz und Golob (1979) waren bei 60% der 1565 Befragten 1% der Fragen
unbeantwortet und bei 10% fehlten sogar 5% der Daten (Lehmann, 1989, S.369). Beim
Vorkommen fehlender Werte muss man zunächst Klarheit über die Struktur des Ausfalls
gewinnen, um die richtige Lösung, bzw. Korrektur anzuwenden. Im Rahmen der
Strukturanalyse muss also zunächst untersucht werden, ob der zu Grunde liegende
Ausfallmechanismus zufälliger Natur ist, oder ob ein systematischer Zusammenhang zu
befürchten ist. Ein Ignorieren dieses Problems oder die Benutzung einer Ad-hoc-Lösung
kann das Ergebnis verzerren. Denn die Anwendung der einfachsten und nicht zuletzt wohl
deswegen beliebtesten Methode, der Dateneliminierung, ist nur unter einer sehr strikten
Voraussetzung, nämlich dass der Datenausfall vollkommen zufällig ist, richtig. Außer der
Dateneliminierung besteht noch u. A. die Möglichkeit der Vervollständigung der Daten mit
Schätzwerten oder die direkte Schätzung aus den unvollständigen Daten. Alle diese
Methoden setzen allerdings eine zufällige Verteilung der fehlenden Werte voraus. Ein
systematisches Fehlen erfordert komplizierte Lösungsschritte und die Kenntnis über die
Struktur des Ausfalls.
Beim Vorliegen eines vollkommen zufälligen Ausfalls ist man frei in der Auswahl der Korrekturmöglichkeit. Wenn die fehlenden Werte nur innerhalb des Merkmals unsystematisch wegbleiben, fallen die Möglichkeiten der Eliminierung, der Sensitivitätsanalyse und fast alle Methoden der Imputation aus. Sind die Datenausfälle gar systematisch, bleibt praktisch nur die Modellierung des Ausfallmechanismus.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
verfügbaren Instrumenten zu lösen und dabei möglichst vollständige Datensätze aus
Primärforschung oder Deskresearch zu verwenden. Dies ist jedoch häufigunmöglich,
auch wenn dasjenige Untersuchungsdesign verwendet wird, bei dem wenige Ausfälle
vermutet werden. Bei der Auswahl des entsprechenden Erhebungsdesigns sollte man sich
im Klaren über mögliche Ausfallursachen sein (Herrmann/Homburg, 2000, S.81ff). So
kann in einem Interview falsches Verständnis der Frage, die Auskunftsunfähigkeit oder der
Unwille zur Beantwortung der Frage zu fehlenden Werten führen. Vor allem Fragen zu
Einkommen, Sexualverhalten oder Alkoholkonsum werden oft nicht beantwortet. So gibt
es viele Datensätze in der Marktforschung, die unvollständig sind: In einem Panel von
Horowitz und Golob (1979) waren bei 60% der 1565 Befragten 1% der Fragen
unbeantwortet und bei 10% fehlten sogar 5% der Daten (Lehmann, 1989, S.369). Beim
Vorkommen fehlender Werte muss man zunächst Klarheit über die Struktur des Ausfalls
gewinnen, um die richtige Lösung, bzw. Korrektur anzuwenden. Im Rahmen der
Strukturanalyse muss also zunächst untersucht werden, ob der zu Grunde liegende
Ausfallmechanismus zufälliger Natur ist, oder ob ein systematischer Zusammenhang zu
befürchten ist. Ein Ignorieren dieses Problems oder die Benutzung einer Ad-hoc-Lösung
kann das Ergebnis verzerren. Denn die Anwendung der einfachsten und nicht zuletzt wohl
deswegen beliebtesten Methode, der Dateneliminierung, ist nur unter einer sehr strikten
Voraussetzung, nämlich dass der Datenausfall vollkommen zufällig ist, richtig. Außer der
Dateneliminierung besteht noch u. A. die Möglichkeit der Vervollständigung der Daten mit
Schätzwerten oder die direkte Schätzung aus den unvollständigen Daten. Alle diese
Methoden setzen allerdings eine zufällige Verteilung der fehlenden Werte voraus. Ein
systematisches Fehlen erfordert komplizierte Lösungsschritte und die Kenntnis über die
Struktur des Ausfalls.
Beim Vorliegen eines vollkommen zufälligen Ausfalls ist man frei in der Auswahl der Korrekturmöglichkeit. Wenn die fehlenden Werte nur innerhalb des Merkmals unsystematisch wegbleiben, fallen die Möglichkeiten der Eliminierung, der Sensitivitätsanalyse und fast alle Methoden der Imputation aus. Sind die Datenausfälle gar systematisch, bleibt praktisch nur die Modellierung des Ausfallmechanismus.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.