Morphologie

Morphologie
†bersicht
Grundbegriffe
Vollformen-Lexikon
Morphologische Analyse mit DCGs
Trennen in Stamm und Endung
Flexionsklassen
Schnittstelle zwischen Syntax und Semantik
Ziel
Verstehen des Problems
In der Lage sein, eine DCG mit einfacher Morphologiebehandlung
zu schreiben
Morphologie Ð 1
Grundbegriffe
Womit befasst sich die Morphologie?
ÈAufbau der WšrterÇ
bessere Definitionen ® Lexika und LehrbŸcher der Linguistik
Derivation vs. Komposition
Derivation
Frucht ® FrŸchte, fruchten, fruchtbar, unfruchtbar, Unfruchtbarkeit, É
Gott ® Gottes, Gštter, Gšttin, Gšttinnen, vergšttern, Gottheit, É
Komposition
Unfruchtbarkeit + Fugen-s + Gott = Unfruchtbarkeitsgott
Unfruchtbarkeitsgšttinen + Verehrung = Unfruchtbarkeitsgšttinenverehrung
Unfruchtbarkeitsgšttinenverehrung + Fugen-s + Zeremonienmeister
= Unfruchtbarkeitsgšttinenverehrungszeremonienmeister
Morphologie Ð 2
Vollformen-Lexikon
n(nom,
n(gen,
n(dat,
n(dat,
n(akk,
n(nom,
n(gen,
n(dat,
n(akk,
sg)
sg)
sg)
sg)
sg)
pl)
pl)
pl)
pl)
-->
-->
-->
-->
-->
-->
-->
-->
-->
[kind].
[kindes].
[kind].
[kinde].
[kind].
[kinder].
[kinder].
[kindern].
[kinder].
n(nom,
n(gen,
n(dat,
n(dat,
n(akk,
n(nom,
n(gen,
n(dat,
n(akk,
Flexionsformen von ÈKindÇ
sg)
sg)
sg)
sg)
sg)
pl)
pl)
pl)
pl)
-->
-->
-->
-->
-->
-->
-->
-->
-->
[lied].
[liedes].
[lied].
[liede].
[lied].
[lieder].
[lieder].
[liedern].
[lieder].
Flexionsformen von ÈLiedÇ
Vollformen-Lexikon in einer Definit-Klausel-Grammatik
Regeln fŸr ÈPrŠterminalsymboleÇ, Wšrter zwischen [ und ]
der Einfachheit halber befassen wir uns hier nicht mit Gross- und
Kleinschreibung
Morphologie Ð 3
Vollformen-Lexikon: Probleme
Flexion mit Vollformen-Lexikon ist aufwendig
fŸr Englisch (da flexionsarme Sprache): noch halbwegs praktikabel
fŸr Deutsch:
Substantive: Kasus ´ Numerus = 8 Formen
Adjektive, Verben: mehr Formen
Finnische Verben: ~12Õ000 Formen
Morphologie Ð 4
Vollformen-Lexikon: Probleme
Gibt es Ÿberhaupt endlich viele Wšrter?
Komposition kann beliebig (?) komplex werden:
der UnfruchtbarkeitsgšttinenverehrungszeremonienmeisterausbildungskommissionsprŠsidentensesselbezug
der erste, É, viermillioneneinhunderttausendundzweite,
viermillioneneinhunderttausendunddritte, É Schluck
das WŠhrend-der-Vorstellung-in-der-Nase-Bohren ist untersagt
Morphologie Ð 5
LšsungsansŠtze
Grammatiken fŸr Wšrter
Auflisten von Wort-Bestandteilen (Stammformen, Endungen)
Regeln zur Verbindung dieser Bestandteile
Festhalten dieser Regeln als Kontextfreie Grammatiken, DCGs, É
die Formalismen vieler Syntaxtheorien (z.B. HPSG) werden auch
zur Modellierung morphologischer PhŠnomene verwendet
Nachfolgend vorgestellt: Miniatur-Beispiel mit DCGs
Weitere AnsŠtze
Endliche Automaten, Zwei-Ebenen-Morphologie, É
Empfehlenswert: Martin Volks Kurs ÈLexikonaufbau und
MorphologieanalyseverfahrenÇ, Di 16 Ð 18 Uhr
Morphologie Ð 6
Morphologie mit DCGs
Grundidee
Satzgrammatik = Wšrter + Kompositionsregeln
Wortgrammatik = Buchstaben + Kompositionsregeln
ebenfalls denkbar wŠre eine Wortgrammatik, welche die VerknŸpfung von
Morphemen beschreibt
dann mŸsste ein vorgelagerter Prozess die Buchstabenfolge in Morpheme zerlegen
Morphologie Ð 7
ASCII-Codes in Prolog
Eine beliebige Zeichenkette, zwischen zwei " eingeschlossen, wird als Liste der ASCII-Codes dargestellt.
?- Kette = "Hallo Du".
Kette = [72,97,108,108,111,32,68,117].
32
68
72
97
Leerschlag
108
l
111
o
117
u
D
H
a
Morphologie Ð 8
beÇ
Ausga
/
n
i
E
È
ester
ektion
Vgl. L Wintersem
im
Trennen von Stamm und Endung
n_morph(Kas, Num) -->
n_stamm,
n_endung(Kas, Num).
VerknŸpfungsregel
n_stamm --> "kind".
n_stamm --> "lied".
n_stamm --> "bild".
NominalstŠmme
n_endung(nom,
n_endung(gen,
n_endung(dat,
n_endung(dat,
n_endung(akk,
n_endung(nom,
n_endung(gen,
n_endung(dat,
n_endung(akk,
sg)
sg)
sg)
sg)
sg)
pl)
pl)
pl)
pl)
-->
-->
-->
-->
-->
-->
-->
-->
-->
Nominalendungen
Morphologie Ð 9
"".
"es".
"".
"e".
"".
"er".
"er".
"ern".
"er".
Flexionsklassen
Unterschiedliche Wšrter haben unterschiedliche
Flexionsklassen.
n(nom,
n(gen,
n(dat,
n(dat,
n(akk,
n(nom,
n(gen,
n(dat,
n(akk,
sg)
sg)
sg)
sg)
sg)
pl)
pl)
pl)
pl)
-->
-->
-->
-->
-->
-->
-->
-->
-->
[kind].
[kindes].
[kind].
[kinde].
[kind].
[kinder].
[kinder].
[kindern].
[kinder].
n(nom,
n(gen,
n(dat,
n(dat,
n(akk,
n(nom,
n(gen,
n(dat,
n(akk,
Flexionsformen von ÈKindÇ
sg)
sg)
sg)
sg)
sg)
pl)
pl)
pl)
pl)
-->
-->
-->
-->
-->
-->
-->
-->
-->
[brot].
[brotes].
[brot].
[brote].
[brot].
[brote].
[brote].
[broten].
[brote].
Flexionsformen von ÈBrotÇ
Morphologie Ð 10
Flexionsklassen
n_morph(Kas, Num) -->
n_stamm(Klasse),
n_endung(Klasse, Kas, Num).
n_stamm(1)
n_stamm(1)
n_stamm(1)
n_stamm(2)
VerknŸpfungsregel
n_endung(1,
n_endung(1,
n_endung(1,
n_endung(1,
n_endung(1,
n_endung(1,
n_endung(1,
n_endung(1,
n_endung(1,
nom,
gen,
dat,
dat,
akk,
nom,
gen,
dat,
akk,
sg)
sg)
sg)
sg)
sg)
pl)
pl)
pl)
pl)
-->
-->
-->
-->
-->
-->
-->
-->
-->
-->
-->
-->
-->
"kind".
"lied".
"bild".
"brot".
NominalstŠmme
"".
"es".
"".
"e".
"".
"er".
"er".
"ern".
"er".
Nominalendungen Klasse Nr. 1
Morphologie Ð 11
n_endung(2,
n_endung(2,
n_endung(2,
n_endung(2,
n_endung(2,
n_endung(2,
n_endung(2,
n_endung(2,
n_endung(2,
nom,
gen,
dat,
dat,
akk,
nom,
gen,
dat,
akk,
sg)
sg)
sg)
sg)
sg)
pl)
pl)
pl)
pl)
-->
-->
-->
-->
-->
-->
-->
-->
-->
"".
"es".
"".
"e".
"".
"e".
"e".
"en".
"e".
Nominalendungen Klasse Nr. 2
Schnittstelle Syntax/Morphologie
Schnittstelle zwischen Syntax und Morphologie
Syntax: arbeitet mit Atomen
Morphologie: arbeitet mit Zeichenlisten
brotes - "brotes"
Umwandlung: name/2
das in Prolog eingebaute PrŠdikat name/2 verwandelt Atome
in Listen aus ASCII-Codes (und zurŸck)
?- name(brotes, Buchstaben).
Buchstaben = [98,114,111,116,101,115]
?- name(Wort, [98,114,111,116,101,115]).
Wort = brotes
Morphologie Ð 12
Schnittstelle Syntax/Morphologie
np(Kas, Num) -->
det(Kas, Num),
n(Kas, Num).
det(nom, sg) --> [das].
det(nom, pl) --> [die].
n(Kas, Num) :sÇ
ÈDCG
n
o
i
t
k
[Wort],
er
e
Vgl. L ntersemest
i
im W
{ name(Wort, Buchstaben),
phrase(n_morph(Kas, Num), Buchstaben) }.
Anfragen
?- phrase(np(Kasus, Numerus), [die, brote]).
Kasus = nom, Numerus = pl
?- phrase(np(Kasus, Numerus), [die, broter]).
no
Morphologie Ð 13
Probleme, Literatur
Nachteile des vorgestellten Verfahrens
recht ineffizient
nicht direkt zum Generieren verwendbar
Anfrage ?- phrase(np(nom, pl), X). fŸhrt zu Fehlermeldung
Literatur
Morphologie in Prolog: [Covington, 1994]
Morphologie allgemein:
A. Linke/M. Nussbaumer/P. R. Portmann: Studienbuch Linguistik.
TŸbingen: Niemeyer, 1991. ISBN 3-484-31121-5. Seiten 55 Ð 72.
Morphologie Ð 14
Aufgaben: Morphologie
Programmiertechniken der Computerlinguistik 2 á Sommersemester 1999
1. Repetition
Stelle sicher, dass Du verstehst, wie Prolog DCGs verarbeitet. Welchen Zweck besitzen
die geschweiften Klammern in den Folien zur Vorlesung? Schlage nštigenfalls in den
Unterlagen des Wintersemesters nach.
2. Komposition
Definit-Klausel-Grammatiken kšnnen nicht zur in der Flexionsmorphologie eingesetzt
werden, sondern auch in der Kompositionsmorphologie. Schreibe eine Grammatik fŸr
Nominalkompositaformen des Deutschen.
So sollen folgende Wšrter erkannt werden, ohne dass die Komposita im Lexikon
aufgefŸhrt wŠren:
Ð wuerstchenbude
Ð arbeitspause
Ð pausenbrote
Ð arbeitszeit
Ð zeitarbeit
3. Addition
FŸge eine Morphologiebehandlung zur Grammatik fŸr deutsche SŠtze aus dem letzten
Aufgabenblatt hinzu.