Was ist das CIS? Was ist Computerlinguistik? Forschung Berufsbild

LUDWIGMAXIMILIANSUNIVERSITÄT
MÜNCHEN
CIS
CENTRUM FÜR INFORMATIONSUND SPRACHVERARBEITUNG
Was ist das CIS?
Forschung
Das Centrum für Informations- und Sprachverarbeitung (CIS), eine zentrale Einrichtung der Universität
München, betreibt interdisziplinäre Forschung und
Lehre auf dem Gebiet der maschinellen Sprachverarbeitung und ihrer theoretischen Grundlagen.
Die universitäre Forschung auf dem Gebiet der Computerlinguistik versucht, theoretische Grundlagen
für die maschinelle Sprachverarbeitung bereitzustellen, und praktische Probleme bei der maschinellen
Sprachverarbeitung zu lösen
Was ist Computerlinguistik?
Computerlinguistik erforscht die maschinelle Verarbeitung natürlicher Sprachen. Sie erarbeitet die theoretischen Grundlagen der Darstellung, Erkennung und
Erzeugung gesprochener und geschriebener Sprache
durch Maschinen. Praktische Anwendungen sind:
• Klassifikation und Informationssuche in Texten (Internet-Suchmaschinen)
• maschinelle und computerunterstützte Übersetzung
• Umwandlung von gesprochener in geschriebene
Sprache (Spracherkennung)
• Dialogsysteme, z.B. elektronische Telefonauskunft
• Erstellung und Nutzung sehr umfangreicher elekronischer Lexika
• Rechtschreibkorrektur und Grammatikprüfung
• automatische Textzusammenfassungen
• Textgenerierung aus elektronischen Daten
Die theoretische Computerlinguistik untersucht die
Beschreibung von Sprachen auf ihre Berechenbarkeit mit Computern. Dadurch trägt sie dazu bei, das
praktisch Machbare vom praktisch Unmöglichen zu
trennen.
Bei der praktischen Computerlinguistik geht es darum, sprachliches Wissen in eine für heutige Computer geeignete Form zu bringen und in realistischen
Anwendungen zu erproben.
Aufgaben der praktischen Computerlinguistik sind
unter anderem das maschinelle Erfassen von Wortschatz und Grammatik einzelner Sprachen, die
Entwicklung von Algorithmen zur Phrasen- und
Textanalyse und das Ermöglichen von Kommunikation zwischen Mensch und Maschine durch Sprachein- und -ausgabe sowie Modelle für Dialogführung
und Spracherwerb.
Die praktische Computerlinguistik kann dabei zwar
auf Methoden der Informatik - insbesondere des
Compilerbaus - zurückgreifen, muss aber diese
Methoden auf natürliche Sprachen ausdehnen, was
wegen der Wortformen- und Ausdrucksvielfalt schon
für die Syntax große Probleme aufwirft. Noch
schwieriger ist es, die für Programmiersprachen
und logische Formelsprachen entwickelte Semantik
auf eine Semantik für natürliche Sprachen auszudehnen, die zur Verwendung in Maschinen geeignet ist.
Berufsbild
Große Softwarehäuser oder Verlage von Wörterbüchern beschäftigen Computerlinguisten, die an der
Erschließung ihrer Sprachdatenbestände (z.B. für
elektronische Taschenwörterbücher) oder an einer
akustischen Eingabe für die Textverarbeitung bis
hin zu Übersetzungsprogrammen arbeiten.
Suchmaschinen verwenden zunehmend linguistisches Know-How. Gerade kleinere semantisch
anspruchsvollere spezialisierte Suchmaschinen
(Produkte, Jobs etc.) sind auf Computerlinguisten
angewiesen.
Interessante Arbeitsmöglichkeiten bieten auch
Universitäten in der gesamten Welt, an denen die
Computerlinguistik mittlerweile einen festen Platz
einnimmt.
Der Technologiestandort München verheißt gute
Aussichten auf Praktika und Arbeitsplätze im näheren Umfeld der Universität. Viele Suchmaschinenfirmen (Lycos, Yahoo und FAST Search & Transfer)
haben Niederlassungen in München.
LUDWIGMAXIMILIANSUNIVERSITÄT
MÜNCHEN
CENTRUM FÜR INFORMATIONSUND SPRACHVERARBEITUNG
Studium
Anfahrt
Die Computerlinguistik verwendet Kenntnisse aus
sehr unterschiedlichen Forschungsdisziplinen:
Das CIS befindet sich im ehemaligen Sitz von Radio
Free Europe, direkt am Englischen Garten. Das Sekretariat und die meisten Mitarbeiter sind im ersten
Stockwerk, Flügel B zu finden.
• aus der Sprachwissenschaft die Begriffe zur Beschreibung von Wortbildung (Morphologie), Satzund Textaufbau (Syntax), Bedeutung (Semantik)
und Verwendungsweise (Pragmatik)
Mit den Bussen 54 und 154 und der Straßenbahn
17 ist das CIS gut zu erreichen (Haltestelle Tivolistraße oder Hirschauer Straße).
• aus der Informatik Programmiersprachen und
Methoden ihrer Übersetzung in maschinennahe
Sprachen; effiziente Speicher- und Suchverfahren
LUDWIGMAXIMILIANSUNIVERSITÄT
MÜNCHEN
CENTRUM FÜR INFORMATIONSUND SPRACHVERARBEITUNG
• aus der mathematischen Logik – zur Modellierung
von Bedeutungen – logische Formelsprachen
• aus der Mathematik und Phonetik statistische Verfahren
• aus der Kommunikationswissenschaft und Kognitionspsychologie Erkenntnisse über Dialogstrategien und Aufmerksamkeitssteuerung
Computerlinguistik wird am CIS als Magister- oder
Aufbau-Studiengang, als Nebenfach und als European Master in Computational Linguistics angeboten.
Computerlinguistik ist am CIS kein Massenstudiengang – der persönliche Kontakt zum Dozenten ist
Normalität. Viele Kurse sind klein und ermöglichen
einen dialogorientierten Lehrstil.
Viele Studenten kommen aus Osteuropa, Asien oder
dem nahen Osten. Außerdem besteht ein Austausch
mit Universitäten in Barcelona, Paris, Besançon, Venedig und Dublin.
Anschrift
Centrum für Informations- und Sprachverarbeitung
Ludwig-Maximilians-Universität
Oettingenstr. 67
80538 München
Tel: +49 89 2180 9721
Fax: +49 89 2180 9701
E-Mail: [email protected]
http://www.cis.uni-muenchen.de
http://www.cis.uni-muenchen.de/fachschaft/
CIS