Projekt: Text Mining in der Praxis, WS 2015/2016

Projekt: Text Mining in der Praxis, WS 2015/2016
Das Projekt vermittelt wie Text Mining von Unternehmen zur Wissensgenerierung und damit
zur Verbesserung des Geschäftsergebnisses gezielt eingesetzt werden kann.
Jeden Tag werden 2,5 Quadrillarden bytes an Daten produziert, von denen weniger als ein
Prozent analysiert werden. Mehr als 80% dieser Daten liegen in unstrukturierter Form vor,
so dass klassische Data Mining Verfahren zur Wissensgenerierung nicht direkt angewendet
werden können. Vor dem Hintergrund einer permanent zunehmenden Informationsflut sind
Analysewerkzeuge zur Bearbeitung von natürlichsprachlichen Texten ein wichtiger
Erfolgsfaktor für Unternehmen geworden. Beispiele hierfür sind Volltextdatenbanken,
Unternehmenswebseiten, Blogs oder auch Emails.
Ziele beim Text Mining Projekt sind, aus Textmaterial Schlüsselkonzepte zu erfassen und
verborgene Beziehungen und Trends in der Industrie und Forschung zu erkennen, ohne dass
die genauen Worte bekannt sein müssen, die die Autoren verwendet haben.
Das Tool IBM Text Analytics bietet uns hierfür Textanalysefunktionen, die auf Basis
linguistischer Technologien und der Verarbeitung natürlicher Sprache (Natural Language
Processing, NLP) eine schnelle Verarbeitung einer großen Vielfalt an unstrukturierten
Textdaten ermöglichen. Die ermittelten Schlüsselkonzepte können extrahiert, geordnet und
kategorisiert werden. Mit einer Kombination aus Textmining und Data-Mining können dabei
mehr Erkenntnisse gewonnen werden als allein aus strukturierten oder unstrukturierten
Daten möglich sind.
Ablauf:
1. Grundlagen zum Textmining und
seine Anwendungsmöglichkeiten.
2. Ermittlung des Textes, auf den das
Mining angewendet werden soll
3. Einsatz der Text Analytics Software
(dokumenten- und webbasiert) und
Extraktion strukturierter Daten
4. Erstellung der Konzept- und
Kategoriemodelle
5. Analyse strukturierter Daten zur
Aufdeckung der Beziehungen
zwischen den Konzepten und
Vorhersage zukünftigen Verhaltens
Quelle: http://www.kdnuggets.com/
Organisation:
Aufwand und CP:
Prüfung:
Erforderliche Vorkenntnisse:
Zielgruppe:
Fragen und Kontakt:
3h begleitet, 3 selbständige Arbeit, 9 CP
Projektfortschritt und Projektergebnisse
Interesse am Thema, Kreativität und Spieltrieb,
Fähigkeit zur Gruppenarbeit
Dieses Projekt richtet sich an alle Studierende der
Wirtschaftsinformatik
Prof. Dr. Klaus-Peter Schoeneberg
[email protected]