Viewing posts from: %s
31Jan
Zu Besuch im Stasi-Unterlagen-Archiv: Teilnahme an dem Interessenbekundungsverfahren zur virtuellen Rekonstruktion der Stasi-Akten

Das Bundesarchiv bewahrt zerrissene Stasi-Akten im Umfang von 40 bis 55 Millionen Seiten auf. Diese sollen durch automatische virtuelle Rekonstruktion wiederhergestellt werden. Ein vorangegangenes Pilotprojekt konnte die Aufgabe nur unzureichend abschließen, wie sogar die Tagesschau am 21.04.2023 berichtet. Nun wurde ein Interessenbekundungsverfahren für ein zweiteiliges Projekt bestehend aus Scanprozess und virtueller Rekonstruktion ausgeschrieben. Dabei bewerben wir uns um die automatische virtuelle Rekonstruktion. Die Kernaufgabe ist die Entwicklung eines automatisierten Verfahrens zur Anordnung von eingescannten Dokumentschnipseln zu ganzen Seiten und vollständigen Dokumenten.

Ende Januar waren wir zu Besuch im Stasi-Unterlagen-Archiv, um mit der Vizepräsidentin des Bundesarchivs Alexandra Titze zu sprechen und unseren Ansatz vorzustellen. LangTec als forschungsnaher Technologieanbieter zeichnet sich hierbei durch einen innovativen KI-basierten Ansatz aus, welcher eine effiziente Verarbeitung der großen Text-und Datenmengen, die die Menge an Stasi-Unterlagen unweigerlich darstellen, ermöglicht.

Wir verfolgen die Thematik weiter gespannt und freuen uns, auf eine mögliche Zusammenarbeit!

 

   

Read More
21Dez
Eine Reise von Bethlehem nach Südamerika – Die diesjährige LangTec Weihnachtsfeier

Die Weihnachtszeit ist die Jahreszeit der Freude, des Lachens, der funkelnden Lichter und des köstlichen Essens, und all dies fehlte auch bei der diesjährigen LangTec Weihnachtsfeier nicht. Wir begannen den Abend im wunderschön verschneiten Hamburger Stadtpark und besuchten das Planetarium. Wir reisten 2000 Jahre zurück in der Zeit, um Theorien über den wahren Ursprung des Himmelswunders “Stern von Bethlehem” zu erfahren.
Zurück in der Gegenwart fuhren wir mit dem Moia zum Yaku, einem modernen peruanisch-mexikanischen Fusionsrestaurant im Hamburger Grindelviertel, wo wir Gang für Gang neue, wunderbare und farbenfrohe Geschmackskombinationen und fröhliche Mescal-Cocktails genossen.

Frohe Feiertage von unserer LangTec-Familie an Ihre!

Read More
02Nov
parson und LangTec gehen KI-Kooperation ein

Der Einsatz von Künstlicher Intelligenz wird auch in der Technischen Kommunikation immer wichtiger. Um unserer Kundschaft bestmögliche Lösungen für KI-basierte Text- und Sprachanwendungen bieten zu können, schließt parson eine Kooperation mit dem Hamburger Technologieanbieter LangTec. LangTec entwickelt innovative Sprachtechnologie-Lösungen zur effizienten Verarbeitung großer Text- und Datenmengen mit besonderem Fokus auf KI und maschinelles Lernen.

„Das Know-how von LangTec und ihre langjährigen Erfahrungen mit maschinellem Lernen und Künstlicher Intelligenz ergänzen unsere Expertise im Bereich Technische Dokumentation perfekt. Gemeinsam können wir bestmögliche Lösungen für den Einsatz Künstlicher Intelligenz in der Technischen Kommunikation entwickeln.“, betont Ulrike Parson, CEO der parson AG.

„Wir freuen uns sehr über diese enge Kooperation mit der parson AG. Als einer der führenden Anbieter von KI-basierter Sprachtechnologie im deutschsprachigen Raum ist es für uns von besonderer Bedeutung, mit etablierten Playern am Markt zusammenzuarbeiten, die bereit sind, maßgeschneiderte Textanalytik-Lösungen in der Praxis zum Einsatz zu bringen. KI wird dann wertvoll, wenn sie hilft, konkrete Wettbewerbsvorteile zu erzielen.“, erläutert Dr. Patrick McCrae, Gründer und Geschäftsführer von LangTec.

Über parson

parson ist ein führendes Dienstleistungsunternehmen für smarten Content und intelligente Informationslösungen. Die parson AG berät ihre Kundschaft bei der Digitalisierung von Content-Prozessen und der Einführung einer nachhaltigen Content-Strategie. Für Produkte, Software und Dienstleistungen liefert parson semantisch angereicherte, modulare Inhalte, zum Beispiel Anwenderdokumentation, Programmieranleitungen, Online-Hilfen, eLearning-Inhalte und Spezifikationen.

 

Fine-Tuning eines Sprachmodells

Zum Auftakt der Partnerschaft mit LangTec stellt parson auf der diesjährigen tekom-Jahrestagung 2023 ein erstes Modellprojekt vor, das sich mit dem Finetuning eines vortrainierten Large Language Models (LLM) beschäftigt und gemeinsam mit LangTec realisiert wurde.

In ihrem-Vortrag zeigen Helle Hannken-Illjes und Ulrike Parson erste Ergebnisse der domänenspezifischen Anpassung eines LLMs auf kundeneigenen Unternehmensdaten, in dem auch die Verarbeitung sensibler Kundendaten problemlos möglich ist:

„KI ja, aber nicht ChatGPT! Wie komme ich zu meinem eigenen Sprachmodell?“

Fachvortrag von Helle Hannken-Illjes und Ulrike Parson

tekom 2023, 15. November 2023, 9.00 Uhr, Raum C6.2

Mehr erfahren

Read More
22Okt
LangTec hat einen stahlharten Deal abgeschlossen

In Rahmen eines neuen Projektes zur Verbesserung der Nachhaltigkeit im industriellen Sektor freut sich LangTec die Zusammenarbeit mit einem der Global Player in der Stahl- und Metallhandelsbranche mitteilen zu können. Als Teil dieser Zusammenarbeit trägt LangTec sein Fachwissen im Bereich Backend-Entwicklung bei, um beim Entwickeln von Lösungen zu helfen, die revolutionieren werden, wie wir über Kohlenstoffemissionen in der Lieferkette denken.

Das Sustainability Team unseres Kunden hat es sich zur Aufgabe gemacht, Endkunden mit all den Informationen auszustatten, die sie benötigen, um umweltbewusste Entscheidungen zu treffen. Ausgerüstet mit einem wegweisenden System zur Berechnung von Kohlenstoffemissionen über den ganzen Produkt-Lebenszyklus hinweg fügt das Sustainability Team nun die Entwicklungsexpertise von LangTec hinzu, um diese Initiative auf die nächste Stufe zu heben.

Wir tragen zu einer verbesserten Lösung bei, welche es einfacher machen wird, den Umwelteinfluss von verschiedenen Materialien und Lieferanten zu verfolgen und zu analysieren, von der Rohmateriallieferung bis hin zur letzten Etappe des Transports zum Endverbraucher. Zusätzlich ist LangTec eingebunden in die Integration eines Authentifizierungssystems, um die Benutzererfahrung weiter zu optimieren und einen nahtlosen Interaktionspfad hin zu einer grüneren und nachhaltigeren Kundenauswahl bereitzustellen.

Read More
07Aug
Massiv-parallele Produktivlösung in der Cloud zur Transformierung von kurzen Texten im großen Maßstab gestartet

Für unseren Kunden aus Süddeutschland haben wir ein Produktivsystem konzipiert, umfangreich getestet und nun im Cloudbetrieb gestartet, welches pro Tag mehrere zehntausend Texte innerhalb weniger Stunden transformiert und zurückmeldet. Die vom Kunden gesendeten kurzen Texte werden dabei automatisch mittels ChatGPT von OpenAI transformiert. Dabei werden die Antworten von ChatGPT auch linguistisch auf ungewünschte Wörter gecheckt und bei Bedarf Regenerierungen des Textes beauftragt. Um die notwendige Verarbeitungsgeschwindigkeit unter Berücksichtigung der bestehenden Loadbegrenzungen zu erreichen, verwenden wir hochgradige Parallelisierung auf unterschiedlichen architektonischen Ebenen.

Read More
02Aug
Überzeugende Ergebnisse für KI-basierte Autorenunterstützung für technische Redakteur:innen

Wie bereits hier berichtet forscht LangTec mit einem führenden norddeutschen, im Feld der technischen Dokumentation arbeitenden Unternehmen am Einsatz eines KI-basierten Assistenzsystems zur Satzvervollständigung für die Textdomäne technische Dokumentation.

Nun konnten wir für den Proof-of-Concept extrem überzeugende Ergebnisse erzielen. Dazu zählt, dass wir durch das Finetuning eines Basismodells auf Kundendaten, die Vorhersagegenauigkeit für das nächste Wort um 45 (top 10 Vorhersagen) bis 62 (top 1) Prozentpunkte steigern konnten. Zudem ermöglichte das Projekt LangTec seine Expertise im Bereich neuronale Sprachmodelle einzusetzen und zu erweitern, insbesondere bezogen auf tiefergreifende Eingriffe in die Standard-Softwarearchitektur des Sprachmodells.

Read More
27Jul
Von der Alster nach Thailand – LangTec Sommerfest

Dieses Jahr meinte es das Wetter zunächst nicht gut mit uns: Im dritten Anlauf hat es aber geklappt und wir trafen uns bei Sonnenschein im Supper Club Hamburg auf kühle Getränke und Wassersport. Je nach Gusto schipperten wir mit SUP, Kanu oder Tretboot über die Alster, trafen auf irische Musiker und die Wellen des Alsterdampfers.. Aber alle blieben trocken und so ging es am Abend Richtung Schanze zu JING JING. Ein hervorragendes 4-Gänge-Menü voller Geschmacksexplosionen katapultierte uns förmlich nach Thailand! Was nun genau zum Konzept gehörte, und was nicht, bleibt wohl offen, aber wir können sagen, dass wir eine fantastische Zeit hatten 🙂

 

 

Read More
01Jun
KI-basierte Autorenunterstützung für technische Redakteur:innen

Regulierungen und Konventionen führen auf dem Feld der technischen Dokumentation zu einer hochdomänenspezifischen Sprache, die beim Verfassen neuer Dokumente konsistent eingehalten werden muss. Heute im Einsatz befindliche Systeme können einheitliche Formulierungen oder Strukturen bisher nur anhand von fest vorgegebene, vorab definierten Regeln erkennen. In einem gemeinsamen Forschungsvorhaben entwickelt LangTec nun als Proof of Concept ein Assistenzsystem, das für einen gegebenen Kontext sinnvolle Satzvervollständigungen anbieten ohne dabei auf ein explizit gepflegtes Regelwerk zurückgreifen zu müssen.

Hauptziel dieses KI-Projekts ist es, technische Redakteur:innen von wiederkehrenden, manuellen Arbeiten zu entlasten. Bei der Erstellung neuer Dokumente soll für angefangene Sätze kontext- und domänensensitiv die passendste Fortsetzung vorgeschlagen werden. Dazu wird LangTec anforderungsgetrieben ein großes Basis-Sprachmodell auswählen, dieses auf Basis einer großen Menge bestehender Dokumente durch Finetuning auf die Domäne anpassen und die Genauigkeit der Vorhersage des resultierenden Modells formal evaluieren.

Read More
15Mai
Neues Projekt: Paraphrasierung von Kurztexten mittels ChatGPT

Um die Suchmaschinenrelevanz von Textextrakten zu erhöhen, untersuchen wir für einen unserer Kunden die Paraphrasierungskompetenz des Sprachmodells ChatGPT. Ziel hierbei ist es, Volltexte automatisiert zu reduzieren (Text Summarisation) und mit Umformulierungen (Paraphrase) Textsnippets zu erzeugen, die von der Suchmaschine als möglichst „unique“ (einzigartig) bewertet werden. Durch die Optimierung der textlichen Uniqueness sollen die Snippets in der Trefferliste in der Websuche möglichst hoch gerankt werden und so zu einer besseren Conversion führen.
Für die Durchführung dieses Projekts hat LangTec eigens ein Maß zur Quantifizierung der textlichen Uniqueness konzipiert und operationalisiert. Auch in diesem Projekt bringt LangTec somit seine computerlinguistische Expertise und langjährige Erfahrung in der automatisierten Generierung von Texten ein.

Read More
28Apr
Erfolgreich umgesetzte datengetriebene Generierung von Musterstellenanzeigen mit ChatGPT

Für einen Anbieter im Bereich Recruiting haben wir erfolgreich die Generierung von Musterstellenanzeigen mit dem großskaligen Sprachmodell ChatGPT realisiert. Die mit unserer Lösung generierten Mustertexte dienen rekrutierenden Firmen in der Erstellung ihrer Stellenausschreibungen als inhaltlicher Ausgangspunkt für weitere individuelle Anpassungen.
Dazu entwickelte LangTec eine Webapp sowie geeignete Anweisungen, sogenannte „Prompts“, für das Sprachmodell von OpenAI. Die Prompts beinhalteten auch textlich relevante Informationen aus einer domänenspezifischen Datenbank, welche von ChatGPT in der Ausgabe berücksichtigt werden sollen.
Nachdem wir in der Vergangenheit bereits über viele Jahre hinweg mit unserer eigens entwickelten Lösung TextWriter umfangreiche Textgenerierungslösungen auf Basis von templatebasierter Textgenerierung (NLG) umgesetzt haben, freuen wir uns, mit diesem Projekt nun auch generative Sprachmodelle in unseren Projekten zur Textgenerierung einzusetzen.

Read More
Top