Möglichkeiten der Erforschung grammatischer Variation mithilfe von

Mittwoch, 9. März 2016, 14.00 Uhr (Methodenmesse)
Möglichkeiten der Erforschung grammatischer Variation mithilfe von KorAP
Marc Kupietz, Nils Diewald, Michael Hanl, Eliza Margaretha (IDS)
KorAP, die neue Korpusanalyseplattform des IDS, die COSMAS II im Laufe der kommenden 2-3
Jahre sukzessive ablösen wird, bietet gerade zur Untersuchung grammatischer Phänomene und
ihrer Variation einige besondere Funktionalitäten. Grundlegend ist z.B., dass KorAP die Repräsentation und Abfrage von Konstituenz- und Dependenzannotationen unterstützt und damit die
Suche nach speziellen grammatischen Phänomenen erleichtert oder überhaupt erst möglich
macht. Die Anzahl der verschiedenen, potenziell auch konkurrierenden Annotationsschichten ist
dabei unbegrenzt. Diese Eigenschaft ist gerade für die sprachwissenschaftliche Verwendung von
Annotationen oberhalb einer morphosyntaktischen Ebene wichtig, da diese typischerweise geringe Genauigkeiten aufweisen. Durch die Verwendung von Annotationen, die aus verschiedenen Quellen stammen (z.B. automatische Annotationswerkzeuge) und ggf. auf unterschiedlichen
Daten trainiert wurden, können wahlweise durch disjunktive Anfragen Recall maximiert und
Typ-II-Fehler minimiert werden oder durch konjunktive Anfragen Präzision maximiert und damit Typ-I-Fehler minimiert werden.
Für die Untersuchung von Variation in Abhängigkeit verschiedener Metadaten-Parameter wie
z.B. Texttyp, Thema, Publikationsort oder -zeit dürften KorAPs Funktionalitäten zur Konstruktion virtueller Korpora interessant sein. Diese können nun anhand von Kombinationen von Metadatenausprägungen definiert werden und zur weiteren Verwendung, und ggf. zur späteren Replikation durch andere Nutzer, persistent gespeichert werden. Geplant ist in diesem Zusammenhang auch eine Funktionalität, die es erlaubt, Trefferanzahlen von Suchanfragen bzgl. verschiedener virtueller Korpora zu kontrastieren und Unterschiede auf ihre Signifikanz zu überprüfen.
Eine ähnliche Funktionalität zur Untersuchung der Verteilung von Ergebnismengen bzgl. verschiedener Achsen (Zeit, Thema, Texttyp, s.o.) ist auch für die Anwendung auf einfachen virtuellen Korpora geplant.
Im Rahmen der Systemdemonstration auf der Methodenmesse können die KorAP-Funktionalitäten direkt ausprobiert werden bzw. geplante und weitere Features diskutiert werden.