Projekt: Text Mining in der Praxis, WS 2015/2016 Das Projekt vermittelt wie Text Mining von Unternehmen zur Wissensgenerierung und damit zur Verbesserung des Geschäftsergebnisses gezielt eingesetzt werden kann. Jeden Tag werden 2,5 Quadrillarden bytes an Daten produziert, von denen weniger als ein Prozent analysiert werden. Mehr als 80% dieser Daten liegen in unstrukturierter Form vor, so dass klassische Data Mining Verfahren zur Wissensgenerierung nicht direkt angewendet werden können. Vor dem Hintergrund einer permanent zunehmenden Informationsflut sind Analysewerkzeuge zur Bearbeitung von natürlichsprachlichen Texten ein wichtiger Erfolgsfaktor für Unternehmen geworden. Beispiele hierfür sind Volltextdatenbanken, Unternehmenswebseiten, Blogs oder auch Emails. Ziele beim Text Mining Projekt sind, aus Textmaterial Schlüsselkonzepte zu erfassen und verborgene Beziehungen und Trends in der Industrie und Forschung zu erkennen, ohne dass die genauen Worte bekannt sein müssen, die die Autoren verwendet haben. Das Tool IBM Text Analytics bietet uns hierfür Textanalysefunktionen, die auf Basis linguistischer Technologien und der Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) eine schnelle Verarbeitung einer großen Vielfalt an unstrukturierten Textdaten ermöglichen. Die ermittelten Schlüsselkonzepte können extrahiert, geordnet und kategorisiert werden. Mit einer Kombination aus Textmining und Data-Mining können dabei mehr Erkenntnisse gewonnen werden als allein aus strukturierten oder unstrukturierten Daten möglich sind. Ablauf: 1. Grundlagen zum Textmining und seine Anwendungsmöglichkeiten. 2. Ermittlung des Textes, auf den das Mining angewendet werden soll 3. Einsatz der Text Analytics Software (dokumenten- und webbasiert) und Extraktion strukturierter Daten 4. Erstellung der Konzept- und Kategoriemodelle 5. Analyse strukturierter Daten zur Aufdeckung der Beziehungen zwischen den Konzepten und Vorhersage zukünftigen Verhaltens Quelle: http://www.kdnuggets.com/ Organisation: Aufwand und CP: Prüfung: Erforderliche Vorkenntnisse: Zielgruppe: Fragen und Kontakt: 3h begleitet, 3 selbständige Arbeit, 9 CP Projektfortschritt und Projektergebnisse Interesse am Thema, Kreativität und Spieltrieb, Fähigkeit zur Gruppenarbeit Dieses Projekt richtet sich an alle Studierende der Wirtschaftsinformatik Prof. Dr. Klaus-Peter Schoeneberg [email protected]
© Copyright 2024 ExpyDoc