Regulierungen und Konventionen führen auf dem Feld der technischen Dokumentation zu einer hochdomänenspezifischen Sprache, die beim Verfassen neuer Dokumente konsistent eingehalten werden muss. Heute im Einsatz befindliche Systeme können einheitliche Formulierungen oder Strukturen bisher nur anhand von fest vorgegebene, vorab definierten Regeln erkennen. In einem gemeinsamen Forschungsvorhaben entwickelt LangTec nun als Proof of Concept ein Assistenzsystem, das für einen gegebenen Kontext sinnvolle Satzvervollständigungen anbieten ohne dabei auf ein explizit gepflegtes Regelwerk zurückgreifen zu müssen.

Hauptziel dieses KI-Projekts ist es, technische Redakteur:innen von wiederkehrenden, manuellen Arbeiten zu entlasten. Bei der Erstellung neuer Dokumente soll für angefangene Sätze kontext- und domänensensitiv die passendste Fortsetzung vorgeschlagen werden. Dazu wird LangTec anforderungsgetrieben ein großes Basis-Sprachmodell auswählen, dieses auf Basis einer großen Menge bestehender Dokumente durch Finetuning auf die Domäne anpassen und die Genauigkeit der Vorhersage des resultierenden Modells formal evaluieren.