ReqCheck: AUTOMATISIERTE QUALITÄTSSICHERUNG VON ANFORDERUNGEN MIT HILFE LINGUISTISCHER REGELN Ursula Reuther, IAI (Institut für Angewandte Informationsforschung) Matthias Koch, Fraunhofer IESE © Fraunhofer IESE, IAI [email protected] [email protected] IAI - Institut für Angewandte Informationsforschung gegründet 1985 als so genanntes „An-Institut“ Institut der Gesellschaft für Angewandte Informationsforschung an der Universität des Saarlandes e.V. Zweck: Technologie- und Wissenstransfer in den Bereichen Natural Language Processing und Language Engineering 2 © Fraunhofer IESE, IAI IAI - Institut für Angewandte Informationsforschung Projektträger: Projektträger: EU BMWi BMBF Saarland Maschinelle Übersetzung Sprachlernsoftware (eLearning) Big Data Intelligente Inhaltserschließung Sprachprüfsoftware Automatische Lexikonaquisition Automobilindustrie Verlage Softwarehersteller Maschinenbau Verwaltungen Kundenspezifische Softwareanpassungen Sprachtechnologische Anwendungen Dienstleistungen und Beratung 3 © Fraunhofer IESE, IAI Die Fraunhofer-Gesellschaft auf einen Blick Anwendungsorientierte Forschung zum unmittelbaren Nutzen für die Wirtschaft und zum Vorteil für die Gesellschaft 2 Mrd 1,7 Mrd Knapp 24 000 Mitarbeiterinn en und Mitarbeiter Vertragsforschung knapp 30% Grundfinanzierung durch Bund und Länder Finanzvolumen 66 Institute und Forschungseinrichtungen Ausbauinvestitionen und Verteidigungsforschung über 70% Industrieaufträge und öffentlich finanzierte Forschungsprojekte 2014 4 © Fraunhofer IESE, IAI Fraunhofer IESE Das Institut für Software- und Systementwicklungsmethoden Gegründet 1996 mit Sitz in Kaiserslautern ca. 240 Mitarbeiter Unsere Lösungen sind flexibel skalierbar und für Firmen jeder Größe geeignet Unsere wichtigsten Branchen: Automobil- und Transportsysteme Informationssysteme Automatisierung und Anlagenbau Energiemanagement Gesundheitswesen E-Government 5 © Fraunhofer IESE, IAI AGENDA Anforderungsdokumentation Qualitätsproblematik bei Anforderungen Technische Dokumentation: Gemeinsamkeiten und Unterschiede Lösungen in der Technischen Dokumentation Anpassung auf den Anforderungskontext Implementierung der angepassten Lösung Unterschiede zu traditionellen Lösungen Erfahrungen und zukünftige Arbeiten 8 © Fraunhofer IESE, IAI Anforderungsdokumentation Natürlichs prachliche Anforderungen Eigenschaften Vorteile • Unstrukturiert (z.B. Fließtext) • Strukturiert (z.B. Use Cases Vorlagen) • Am häufigsten verwendete Form für Dokumentation • Hohe Flexibilität • Verwendbar für alle Arten von Anforderungen • Können von allen Stakeholdern verstanden werden, ohne neue Notationen / Sprachen zu lernen 9 © Fraunhofer IESE, IAI Qualitätsproblematik bei Anforderungen Problem e in der Prax is [Kan03] Untersucht wurden 967 natürlichsprachliche Anforderungen 223 Anforderungen haben weak words. (~23%) 83 Anforderungen waren nicht Singular. 53 Anforderungen waren nicht kurz und einfach. 37 Anforderungen waren unvollständig. 23 Anforderungen verwenden Negierungen. [Kan03] Kandt, R. K. 2003: Software Requirements Engineering: Practices and Techniques. JPL Document D-24994. SQI Report R-3. Jet Propulsion Laboratory. California Institute of Technology © Fraunhofer IESE, IAI 10 Qualitätsproblematik bei Anforderungen Viele dies er S chw achs tellten las s en s ich autom atis iert prüfen . Einfache Prüfung der Wörter greift aber oft zu kurz Komplexere Problematiken: • • • • • • • Layout und Darstellung, Satzbau und Komplexität, Schreibstil, Wortstellungen, Wortwahl, Substantive ohne Bezugsindex, Unvollständig spezifizierte Bedingungen 11 © Fraunhofer IESE, IAI Technische Dokumentation: Gemeinsamkeiten und Unterschiede Anforderungen an Technische Dokumentation Anforderungen an Anforderungsdokumentation (IEEE 29148) verständlich verständlich realisierbar eindeutig eindeutig prüfbar konsistent konsistent notwendig sprachlich korrekt vollständig abgestimmt zielgruppengerecht verfolgbar gut übersetzbar gemäß CI-Vorgaben 12 © Fraunhofer IESE, IAI Lösungen in der Technischen Dokumentation Software zur Sprachqualitätssicherung Autorenunterstützung Maschinelles Lektorat Überprüfung von Rechtschreibung Grammatik Terminologie Stil und Verständlichkeit integriert in Redaktionsumgebung integriert in Dokumentfreigabeprozess 13 © Fraunhofer IESE, IAI Anpassung auf den Anforderungskontext Ermittelte Regelsätze für Anforderungen Manche Regeln sind im RE Kontext kontraproduktiv oder unpassend 76 Regeln w urden unters ucht Identifizierte Probleme • Schließen Beschreibungsmöglichkeiten aus, bspw. „keine Klammern verwenden“ • Stellen Vereinfachungen über Sprachregeln, bspw. „zu langes Kompositum aufgliedern (>3)“ • Schließen Anredeformen aus, die in bestimmten Fällen erlaubt sind (z.B. bei Use Cases), bspw. „1. Person Singular und Plural vermeiden“ • Prozesswörter werden durch die Stilregeln vermieden, das Problem sind aber unvollständig spezifizierte Prozesswörter 14 © Fraunhofer IESE, IAI Anpassung auf den Anforderungskontext Fallstudie mit 29 identifizierten Regeln 9 Anforderungsdokumente aus verschiedenen Domänen 53.511 Wörter 542 Treffer Manuelles Review Probleme mit false positives Futur als Passiv erkannt Infinitiv als Anrede erkannt 16 false positives 2,95% false positivesRate 15 © Fraunhofer IESE, IAI Anpassung auf den Anforderungskontext Erfahrungen aus der Technischen Dokumentation keine präskriptive „Kontrollierte Sprache“ im klassischen Sinne Regelpool als Basis für eine flexible, individuelle Regelkonfiguration Eins parpotenzial 30 % im Lektorat 15 % im Übersetzungsprozess 5 % im Aftersales (Reparatur und Service) Steigerung der Textqualität Verbesserung der redaktionellen Skills 17 © Fraunhofer IESE, IAI Implementierung der angepassten Lösung https ://reqcheck.ies e.de Entwicklung des Web-Clients mit ASP.net-Technologie Möglichkeit zum Hochladen eines Docx-Dokuments Transformation des DocxDokuments in HTML •über Apache Tika Interne Verarbeitung im Prüfsystem Formatierung der Befunde in HTML •Pop-Over zu Markierungen zeigen betroffene Stellen im geprüften Text •Möglichkeit zum Export der Ergebnisse (pdf und html) Sorgsamer Umgang mit vertraulichen Daten 18 © Fraunhofer IESE, IAI Implementierung der angepassten Lösung https ://reqcheck.ies e.de 19 © Fraunhofer IESE, IAI Implementierung der angepassten Lösung https ://reqcheck.ies e.de 20 © Fraunhofer IESE, IAI Implementierung der angepassten Lösung https ://reqcheck.ies e.de 21 © Fraunhofer IESE, IAI Implementierung der angepassten Lösung https ://reqcheck.ies e.de 22 © Fraunhofer IESE, IAI Implementierung der angepassten Lösung https ://reqcheck.ies e.de 23 © Fraunhofer IESE, IAI Unterschiede zu traditionellen Lösungen Linguistische Verarbeitungsmethoden mit morphosyntaktischer Analyse Traditionelle Ansätze arbeiten oft mit Wortlisten und prüfen auf weak words Multiplizität Negation Unvollständigkeit (z.B.: „TBD“) Passive Formulierungen Subjektive Formulierungen Optionalität Implizität Uneindeutigkeit Vergleichende Phrasen 24 © Fraunhofer IESE, IAI Unterschiede zu traditionellen Lösungen Linguistische Verarbeitungsmethoden mit morphosyntaktischer Analyse Entwässerungsgräben Zerlegung von Wörtern in kleinste bedeutungstragende Einheiten (Morpheme) Flex ion Entwässerungsgraben Kom pos ition Entwässerung # s # graben Deriv ation ent # wässern # ung # graben 25 © Fraunhofer IESE, IAI Unterschiede zu traditionellen Lösungen Linguistische Verarbeitungsmethoden mit morphosyntaktischer Analyse Parse-Beispiel NP [ Die<art> Mitte<noun> ] NP [ einer<art> Verdichterstütze<noun> ] ist<fiv> PP [ mittels<p> NP [ Ansenkung<noun> ] ] PP [ in<p> NP [ der<art> oberen<adj> Tragplatte<noun> ] ] gekennzeichnet<ptc2> .<punct> 26 © Fraunhofer IESE, IAI Unterschiede zu traditionellen Lösungen Berücksichtigung der Dokumentstruktur Vorgaben zur Dokumentstruktur (DTD, Schema, Formatvorlage) Interpretation der Dokumentstruktur • Zuordnung von sprachlichen Inhalten zu ihrer Funktion im Text <TITLE>Das ist eine Überschrift</TITLE> <PROCEDURE>In Handlungsanweisungen darf kein Passiv verwendet werden.</PROCEDURE> . Elementabhängige Überprüfung des Inhalts Keine Fehlermeldung, dass der Satzendepunkt fehlt Regel, die Passiv in Kombination mit Modalverben verbietet, ist auf das Element <PROCEDURE> beschränkt. 27 © Fraunhofer IESE, IAI Unterschiede zu traditionellen Lösungen Direkte Nutzung durch Webservices Gesicherte Verbindung zum Webservice Keine Installation notwendig Einfacher, schneller und flexibler Zugriff Einfache Accountverwaltung • Kein Zugriff auf andere Dokumente • Kein Zugriff auf frühere Prüfungsergebnisse 28 © Fraunhofer IESE, IAI Erfahrungen und zukünftige Arbeiten Erfahrungen • Schnelle und einfache Prüfung „nebenbei“ • Unmittelbare Qualitätsverbesserung möglich • Weniger Kommunikationsaufwand durch bessere Qualität der Dokumentation • Nicht alle Regeln sind für alle Teile eines Dokuments sinnvoll (Überschriften, Tabelleninhalte …) Zukünftige Arbeiten • Berücksichtigung spezifischer Formatierungen • Erweiterung des Regelsets 29 © Fraunhofer IESE, IAI ReqCheck: automatisierte Qualitätssicherung von Anforderungen mit Hilfe linguistischer Regeln Ursula Reuther, IAI (Institut für Angewandte Informationsforschung) Matthias Koch, Fraunhofer IESE [email protected] [email protected] https ://reqcheck.ies e.de 30 © Fraunhofer IESE, IAI
© Copyright 2024 ExpyDoc