Titel mit logo/Titel durch Klicken hinzufügen

ReqCheck:
AUTOMATISIERTE QUALITÄTSSICHERUNG VON
ANFORDERUNGEN MIT HILFE LINGUISTISCHER
REGELN
Ursula Reuther, IAI (Institut für Angewandte Informationsforschung)
Matthias Koch, Fraunhofer IESE
© Fraunhofer IESE,
IAI
[email protected]
[email protected]
IAI - Institut für Angewandte Informationsforschung
 gegründet 1985
 als so genanntes „An-Institut“
Institut der Gesellschaft für Angewandte Informationsforschung an der
Universität des Saarlandes e.V.
 Zweck:
Technologie- und Wissenstransfer in den Bereichen Natural Language
Processing und Language Engineering
2
© Fraunhofer IESE,
IAI
IAI - Institut für Angewandte Informationsforschung
Projektträger:
Projektträger:
EU
BMWi
BMBF
Saarland
Maschinelle Übersetzung
Sprachlernsoftware
(eLearning)
Big Data
Intelligente
Inhaltserschließung
Sprachprüfsoftware
Automatische
Lexikonaquisition
Automobilindustrie
Verlage
Softwarehersteller
Maschinenbau
Verwaltungen
Kundenspezifische
Softwareanpassungen
Sprachtechnologische
Anwendungen
Dienstleistungen und
Beratung
3
© Fraunhofer IESE,
IAI
Die Fraunhofer-Gesellschaft auf einen Blick
Anwendungsorientierte Forschung zum unmittelbaren Nutzen für die
Wirtschaft und zum Vorteil für die Gesellschaft
2 Mrd
1,7 Mrd
Knapp 24 000
Mitarbeiterinn
en und
Mitarbeiter
Vertragsforschung
knapp 30%
Grundfinanzierung
durch Bund und Länder
Finanzvolumen
66 Institute und
Forschungseinrichtungen
Ausbauinvestitionen
und
Verteidigungsforschung
über 70%
Industrieaufträge und
öffentlich finanzierte
Forschungsprojekte
2014
4
© Fraunhofer IESE,
IAI
Fraunhofer IESE
Das Institut für Software- und Systementwicklungsmethoden
 Gegründet 1996 mit Sitz in
Kaiserslautern
 ca. 240 Mitarbeiter
 Unsere Lösungen sind flexibel
skalierbar und für Firmen jeder
Größe geeignet
 Unsere wichtigsten Branchen:

Automobil- und Transportsysteme
 Informationssysteme

Automatisierung und Anlagenbau
 Energiemanagement

Gesundheitswesen
 E-Government
5
© Fraunhofer IESE,
IAI
AGENDA
 Anforderungsdokumentation
 Qualitätsproblematik bei Anforderungen
 Technische Dokumentation: Gemeinsamkeiten und Unterschiede
 Lösungen in der Technischen Dokumentation
 Anpassung auf den Anforderungskontext
 Implementierung der angepassten Lösung
 Unterschiede zu traditionellen Lösungen
 Erfahrungen und zukünftige Arbeiten
8
© Fraunhofer IESE,
IAI
Anforderungsdokumentation
Natürlichs prachliche
Anforderungen
Eigenschaften
Vorteile
• Unstrukturiert (z.B. Fließtext)
• Strukturiert (z.B. Use Cases
Vorlagen)
• Am häufigsten verwendete Form
für Dokumentation
• Hohe Flexibilität
• Verwendbar für alle Arten von
Anforderungen
• Können von allen Stakeholdern
verstanden werden, ohne neue
Notationen / Sprachen zu lernen
9
© Fraunhofer IESE,
IAI
Qualitätsproblematik bei Anforderungen
Problem e in der Prax is [Kan03]
Untersucht wurden 967 natürlichsprachliche
Anforderungen
223
Anforderungen
haben weak
words. (~23%)
83
Anforderungen
waren nicht
Singular.
53
Anforderungen
waren nicht
kurz und
einfach.
37
Anforderungen
waren
unvollständig.
23
Anforderungen
verwenden
Negierungen.
[Kan03] Kandt, R. K. 2003: Software Requirements Engineering: Practices and Techniques. JPL Document D-24994. SQI Report
R-3. Jet Propulsion Laboratory. California Institute of Technology
© Fraunhofer IESE,
IAI
10
Qualitätsproblematik bei Anforderungen
Viele dies er S chw achs tellten las s en s ich autom atis iert prüfen .
 Einfache Prüfung der Wörter greift aber oft zu kurz
Komplexere
Problematiken:
•
•
•
•
•
•
•
Layout und Darstellung,
Satzbau und Komplexität,
Schreibstil,
Wortstellungen,
Wortwahl,
Substantive ohne Bezugsindex,
Unvollständig spezifizierte Bedingungen
11
© Fraunhofer IESE,
IAI
Technische Dokumentation: Gemeinsamkeiten und
Unterschiede
 Anforderungen an
Technische
Dokumentation
 Anforderungen an Anforderungsdokumentation (IEEE 29148)
verständlich
verständlich
realisierbar
eindeutig
eindeutig
prüfbar
konsistent
konsistent
notwendig
sprachlich korrekt
vollständig
abgestimmt
zielgruppengerecht
verfolgbar
gut übersetzbar
gemäß CI-Vorgaben
12
© Fraunhofer IESE,
IAI
Lösungen in der Technischen Dokumentation
 Software zur Sprachqualitätssicherung
Autorenunterstützung
Maschinelles Lektorat
Überprüfung von
 Rechtschreibung
 Grammatik
 Terminologie
 Stil und Verständlichkeit
integriert in
Redaktionsumgebung
integriert in
Dokumentfreigabeprozess
13
© Fraunhofer IESE,
IAI
Anpassung auf den Anforderungskontext
Ermittelte Regelsätze für Anforderungen
Manche Regeln sind im RE Kontext
kontraproduktiv oder unpassend
76 Regeln
w urden
unters ucht
Identifizierte
Probleme
• Schließen
Beschreibungsmöglichkeiten aus,
bspw. „keine Klammern
verwenden“
• Stellen Vereinfachungen über
Sprachregeln, bspw. „zu langes
Kompositum aufgliedern (>3)“
• Schließen Anredeformen aus, die
in bestimmten Fällen erlaubt sind
(z.B. bei Use Cases), bspw. „1.
Person Singular und Plural
vermeiden“
• Prozesswörter werden durch die
Stilregeln vermieden, das
Problem sind aber unvollständig
spezifizierte Prozesswörter
14
© Fraunhofer IESE,
IAI
Anpassung auf den Anforderungskontext
Fallstudie mit 29 identifizierten Regeln
9
Anforderungsdokumente aus
verschiedenen
Domänen
53.511
Wörter
542
Treffer
Manuelles Review
Probleme mit false positives
 Futur als Passiv erkannt
 Infinitiv als Anrede erkannt
16 false
positives
2,95%
false
positivesRate
15
© Fraunhofer IESE,
IAI
Anpassung auf den Anforderungskontext
Erfahrungen aus der Technischen Dokumentation
 keine präskriptive „Kontrollierte Sprache“ im klassischen Sinne
 Regelpool als Basis für eine flexible, individuelle
Regelkonfiguration
Eins parpotenzial
30 % im Lektorat
15 % im Übersetzungsprozess
5 % im Aftersales
(Reparatur und Service)
Steigerung der
Textqualität
Verbesserung der
redaktionellen Skills
17
© Fraunhofer IESE,
IAI
Implementierung der angepassten Lösung
https ://reqcheck.ies e.de
Entwicklung des Web-Clients
mit ASP.net-Technologie
Möglichkeit zum Hochladen
eines Docx-Dokuments
Transformation des DocxDokuments in HTML
•über Apache Tika
Interne Verarbeitung im
Prüfsystem
Formatierung der Befunde in
HTML
•Pop-Over zu Markierungen zeigen betroffene Stellen im geprüften Text
•Möglichkeit zum Export der Ergebnisse (pdf und html)
Sorgsamer Umgang mit
vertraulichen Daten
18
© Fraunhofer IESE,
IAI
Implementierung der angepassten Lösung
https ://reqcheck.ies e.de
19
© Fraunhofer IESE,
IAI
Implementierung der angepassten Lösung
https ://reqcheck.ies e.de
20
© Fraunhofer IESE,
IAI
Implementierung der angepassten Lösung
https ://reqcheck.ies e.de
21
© Fraunhofer IESE,
IAI
Implementierung der angepassten Lösung
https ://reqcheck.ies e.de
22
© Fraunhofer IESE,
IAI
Implementierung der angepassten Lösung
https ://reqcheck.ies e.de
23
© Fraunhofer IESE,
IAI
Unterschiede zu traditionellen Lösungen
Linguistische Verarbeitungsmethoden mit morphosyntaktischer Analyse
 Traditionelle Ansätze arbeiten oft mit Wortlisten und prüfen auf
 weak words
 Multiplizität
 Negation
 Unvollständigkeit (z.B.: „TBD“)
 Passive Formulierungen
 Subjektive Formulierungen
 Optionalität
 Implizität
 Uneindeutigkeit
 Vergleichende Phrasen
24
© Fraunhofer IESE,
IAI
Unterschiede zu traditionellen Lösungen
Linguistische Verarbeitungsmethoden mit morphosyntaktischer Analyse
Entwässerungsgräben
Zerlegung von
Wörtern in
kleinste
bedeutungstragende
Einheiten
(Morpheme)
Flex ion
Entwässerungsgraben
Kom pos ition
Entwässerung # s # graben
Deriv ation
ent # wässern # ung # graben
25
© Fraunhofer IESE,
IAI
Unterschiede zu traditionellen Lösungen
Linguistische Verarbeitungsmethoden mit morphosyntaktischer Analyse
 Parse-Beispiel
NP [ Die<art> Mitte<noun> ]
NP [ einer<art> Verdichterstütze<noun> ]
ist<fiv>
PP [ mittels<p>
NP [ Ansenkung<noun> ]
]
PP [ in<p>
NP [ der<art> oberen<adj> Tragplatte<noun> ]
]
gekennzeichnet<ptc2>
.<punct>
26
© Fraunhofer IESE,
IAI
Unterschiede zu traditionellen Lösungen
Berücksichtigung der Dokumentstruktur
Vorgaben zur
Dokumentstruktur
(DTD, Schema,
Formatvorlage)
Interpretation der
Dokumentstruktur
• Zuordnung von
sprachlichen Inhalten
zu ihrer Funktion im
Text
<TITLE>Das ist eine Überschrift</TITLE>
<PROCEDURE>In Handlungsanweisungen darf
kein Passiv verwendet werden.</PROCEDURE>
.
Elementabhängige
Überprüfung des
Inhalts
Keine Fehlermeldung,
dass der
Satzendepunkt
fehlt
Regel, die Passiv in Kombination mit Modalverben
verbietet, ist auf das Element <PROCEDURE>
beschränkt.
27
© Fraunhofer IESE,
IAI
Unterschiede zu traditionellen Lösungen
Direkte Nutzung durch Webservices
Gesicherte
Verbindung zum
Webservice
Keine Installation
notwendig
Einfacher, schneller
und flexibler Zugriff
Einfache
Accountverwaltung
• Kein Zugriff auf andere Dokumente
• Kein Zugriff auf frühere Prüfungsergebnisse
28
© Fraunhofer IESE,
IAI
Erfahrungen und zukünftige Arbeiten
Erfahrungen
• Schnelle und einfache Prüfung
„nebenbei“
• Unmittelbare
Qualitätsverbesserung
möglich
• Weniger
Kommunikationsaufwand
durch bessere Qualität der
Dokumentation
• Nicht alle Regeln sind für alle
Teile eines Dokuments sinnvoll
(Überschriften, Tabelleninhalte
…)
Zukünftige Arbeiten
• Berücksichtigung spezifischer
Formatierungen
• Erweiterung des Regelsets
29
© Fraunhofer IESE,
IAI
ReqCheck: automatisierte Qualitätssicherung von
Anforderungen mit Hilfe linguistischer Regeln
Ursula Reuther, IAI (Institut für Angewandte Informationsforschung)
Matthias Koch, Fraunhofer IESE
[email protected]
[email protected]
https ://reqcheck.ies e.de
30
© Fraunhofer IESE,
IAI