LUDWIGMAXIMILIANSUNIVERSITÄT MÜNCHEN CIS CENTRUM FÜR INFORMATIONSUND SPRACHVERARBEITUNG Was ist das CIS? Forschung Das Centrum für Informations- und Sprachverarbeitung (CIS), eine zentrale Einrichtung der Universität München, betreibt interdisziplinäre Forschung und Lehre auf dem Gebiet der maschinellen Sprachverarbeitung und ihrer theoretischen Grundlagen. Die universitäre Forschung auf dem Gebiet der Computerlinguistik versucht, theoretische Grundlagen für die maschinelle Sprachverarbeitung bereitzustellen, und praktische Probleme bei der maschinellen Sprachverarbeitung zu lösen Was ist Computerlinguistik? Computerlinguistik erforscht die maschinelle Verarbeitung natürlicher Sprachen. Sie erarbeitet die theoretischen Grundlagen der Darstellung, Erkennung und Erzeugung gesprochener und geschriebener Sprache durch Maschinen. Praktische Anwendungen sind: • Klassifikation und Informationssuche in Texten (Internet-Suchmaschinen) • maschinelle und computerunterstützte Übersetzung • Umwandlung von gesprochener in geschriebene Sprache (Spracherkennung) • Dialogsysteme, z.B. elektronische Telefonauskunft • Erstellung und Nutzung sehr umfangreicher elekronischer Lexika • Rechtschreibkorrektur und Grammatikprüfung • automatische Textzusammenfassungen • Textgenerierung aus elektronischen Daten Die theoretische Computerlinguistik untersucht die Beschreibung von Sprachen auf ihre Berechenbarkeit mit Computern. Dadurch trägt sie dazu bei, das praktisch Machbare vom praktisch Unmöglichen zu trennen. Bei der praktischen Computerlinguistik geht es darum, sprachliches Wissen in eine für heutige Computer geeignete Form zu bringen und in realistischen Anwendungen zu erproben. Aufgaben der praktischen Computerlinguistik sind unter anderem das maschinelle Erfassen von Wortschatz und Grammatik einzelner Sprachen, die Entwicklung von Algorithmen zur Phrasen- und Textanalyse und das Ermöglichen von Kommunikation zwischen Mensch und Maschine durch Sprachein- und -ausgabe sowie Modelle für Dialogführung und Spracherwerb. Die praktische Computerlinguistik kann dabei zwar auf Methoden der Informatik - insbesondere des Compilerbaus - zurückgreifen, muss aber diese Methoden auf natürliche Sprachen ausdehnen, was wegen der Wortformen- und Ausdrucksvielfalt schon für die Syntax große Probleme aufwirft. Noch schwieriger ist es, die für Programmiersprachen und logische Formelsprachen entwickelte Semantik auf eine Semantik für natürliche Sprachen auszudehnen, die zur Verwendung in Maschinen geeignet ist. Berufsbild Große Softwarehäuser oder Verlage von Wörterbüchern beschäftigen Computerlinguisten, die an der Erschließung ihrer Sprachdatenbestände (z.B. für elektronische Taschenwörterbücher) oder an einer akustischen Eingabe für die Textverarbeitung bis hin zu Übersetzungsprogrammen arbeiten. Suchmaschinen verwenden zunehmend linguistisches Know-How. Gerade kleinere semantisch anspruchsvollere spezialisierte Suchmaschinen (Produkte, Jobs etc.) sind auf Computerlinguisten angewiesen. Interessante Arbeitsmöglichkeiten bieten auch Universitäten in der gesamten Welt, an denen die Computerlinguistik mittlerweile einen festen Platz einnimmt. Der Technologiestandort München verheißt gute Aussichten auf Praktika und Arbeitsplätze im näheren Umfeld der Universität. Viele Suchmaschinenfirmen (Lycos, Yahoo und FAST Search & Transfer) haben Niederlassungen in München. LUDWIGMAXIMILIANSUNIVERSITÄT MÜNCHEN CENTRUM FÜR INFORMATIONSUND SPRACHVERARBEITUNG Studium Anfahrt Die Computerlinguistik verwendet Kenntnisse aus sehr unterschiedlichen Forschungsdisziplinen: Das CIS befindet sich im ehemaligen Sitz von Radio Free Europe, direkt am Englischen Garten. Das Sekretariat und die meisten Mitarbeiter sind im ersten Stockwerk, Flügel B zu finden. • aus der Sprachwissenschaft die Begriffe zur Beschreibung von Wortbildung (Morphologie), Satzund Textaufbau (Syntax), Bedeutung (Semantik) und Verwendungsweise (Pragmatik) Mit den Bussen 54 und 154 und der Straßenbahn 17 ist das CIS gut zu erreichen (Haltestelle Tivolistraße oder Hirschauer Straße). • aus der Informatik Programmiersprachen und Methoden ihrer Übersetzung in maschinennahe Sprachen; effiziente Speicher- und Suchverfahren LUDWIGMAXIMILIANSUNIVERSITÄT MÜNCHEN CENTRUM FÜR INFORMATIONSUND SPRACHVERARBEITUNG • aus der mathematischen Logik – zur Modellierung von Bedeutungen – logische Formelsprachen • aus der Mathematik und Phonetik statistische Verfahren • aus der Kommunikationswissenschaft und Kognitionspsychologie Erkenntnisse über Dialogstrategien und Aufmerksamkeitssteuerung Computerlinguistik wird am CIS als Magister- oder Aufbau-Studiengang, als Nebenfach und als European Master in Computational Linguistics angeboten. Computerlinguistik ist am CIS kein Massenstudiengang – der persönliche Kontakt zum Dozenten ist Normalität. Viele Kurse sind klein und ermöglichen einen dialogorientierten Lehrstil. Viele Studenten kommen aus Osteuropa, Asien oder dem nahen Osten. Außerdem besteht ein Austausch mit Universitäten in Barcelona, Paris, Besançon, Venedig und Dublin. Anschrift Centrum für Informations- und Sprachverarbeitung Ludwig-Maximilians-Universität Oettingenstr. 67 80538 München Tel: +49 89 2180 9721 Fax: +49 89 2180 9701 E-Mail: [email protected] http://www.cis.uni-muenchen.de http://www.cis.uni-muenchen.de/fachschaft/ CIS
© Copyright 2024 ExpyDoc