Studienarbeit aus dem Jahr 2019 im Fachbereich Sprachwissenschaft / Sprachforschung (fachübergreifend), Note: 1,3, Technische Universität Bergakademie Freiberg, Sprache: Deutsch, Abstract: Die vorliegende Seminararbeit thematisiert einen Bereich der Informatik, genauer gesagt der Datenwissenschaft, der in dem letzten Jahrzehnt immer mehr an Bedeutung gewonnen und große Fortschritte erzielt hat - Text Mining. Im Zeitalter Big Data nimmt das Aufkommen von digitalen Informationen enorm zu, das aufgrund der günstigen und unbegrenzt verfügbaren Speicherung ermöglicht wird. Experten gehen jedoch davon aus, dass bis zu 80 Prozent aller Unternehmensinformationen in Form unstrukturierter Textdokumente gespeichert sind. So liegen Kundenrezensionen, Patentanmeldungen oder Geschäftsberichte unstrukturiert vor. Mithilfe von linguistischen, statischen und mathematischen Verfahren sollen durch das Text Mining gezielt Muster und Strukturen gefunden und Informationen extrahiert werden. Im Vordergrund der folgenden Seminararbeit stehen die im Kontext Text Mining möglichen Analysemethoden Textklassifikation und Textclustering und mögliche Visualisierungstechniken. Ziel der Arbeit ist es, den Einsatz von Visualisierungen zu veranschaulichen und den Nutzen hervorzuheben. Um einen ersten Einblick in die Thematik zu bekommen, werden im ersten Teil der Arbeit die Begriffe Text Mining und Informationsvisualisierung definiert und eingeordnet. Dabei liegt das Hauptaugenmerkt einerseits auf den typischen Prozessschritten des Text Mining und auf die Abgrenzung vom Text Mining zum Data Mining, andererseits auf den positiven Zugewinn durch die visuelle Wahrnehmung von Informationen und deren Strukturen und die Unterscheidung von Informationsvisualisierung und wissenschaftlichen Visualisierungen. Anschließend werden zwei Methoden innerhalb des Text Mining vorgestellt: Textklassifikation, welches die Sentimentanalyse beinhaltet, und Textclustering, das das Topic Modeling einschließt. Weiterhin werden vier Visualisierungstechniken vorgestellt, wovon die letzten beiden jeweils für die Sentimentanalyse und für das Topic Modeling vorgesehen sind. Abschließend werden im Resümee die Ergebnisse zusammengefasst.
Dieser Download kann aus rechtlichen Gründen nur mit Rechnungsadresse in A, B, BG, CY, CZ, D, DK, EW, E, FIN, F, GR, HR, H, IRL, I, LT, L, LR, M, NL, PL, P, R, S, SLO, SK ausgeliefert werden.