16Mrz
Gold für AlatUno

LangTec hat beim Ideenwettbewerb des hessisches Wirtschaftsministeriums teilgenommen. Ein Problem, das wir dabei lösen wollen, ist die Konversion von Führerscheinen für Nicht-EU-Bürger. Eine Nicht-EU-Fahrerlaubnis ist nur für die ersten sechs Monate nach Ankunft in Deutschland gültig. Danach muss sie zu einer deutschen Fahrerlaubnis geändert werden. Jedoch gibt es je nach Land unterschiedliche Schritte.

Um dabei zu helfen, wollen wir ein Konversionssystem für Führerscheine vorschlagen. Unser Produkt AlatUno, ein mehrsprachiges PDF-Füllsystem, hilft Nutzer:innen beim Ausfüllen der nötigen Formulare. Außerdem kann es, basieren auf einer hochgeladenen Fahrerlaubnis, das Land erkennen und die nötigen weiteren Schritte empfehlen.

Wir haben unsere Lösung bei der letzten Runde des Ideenwettbewerbs vorgestellt. Wir hatten sehr starke und professionelle Konkurrenz. Dennoch hat die Jury letztendlich für uns gewählt und unsere Lösung AlatUno hat die Goldmedaille gewonnen!

Read More
01Mrz
Wir sehen uns bei Teams, Soumya!

Letzte Woche hatten wir einen Team Lunch für Soumya’s Verabschiedung. Soumya wird uns in Zukunft von Indien aus unterstützen. Bei AuthenTikka haben wir gut gespeist und es genossen, Zeit zusammen zu verbringen.

Read More
10Feb
Parser für Schifffahrtskunden

Um den Abrechnungsprozess zwischen Hafenmeister und Reedereien zu erleichtern entwickelt LangTec mit Expertenwissen in NLP für einen Schifffahrtskunden aus Südostasien einen maßgeschneiderten Parser für Dokumente mit kaufmännischen, technischen, Verwaltungs- und Sicherheits-Informationen zu Tankschiffen. Zu den verarbeitenden Dokumenten zählen standardisierte Fragebögen „Questionnaire 88“ und Harbor Timesheets mit Input in den einer Reihe von Inputformaten wie Text, Bild oder Website. Durch Information Ingestion, Parsing, Analytik, Normalisierung sowie Disambiguierung von prozessrelevanten Daten wird unsere Lösung realisiert und als eine REST-konformer Webservice bereitgestellt.

Read More
21Jan
Erweiterung und Optimierung der Annotations- und Analysesoftware CATMA

Die Annotations- und Analysesoftware CATMA ist eine der Kernkomponenten des BMBF-geförderten Forschungsprojektes forTEXT der TU Darmstadt. Im Rahmen von forTEXT sollen umfangreiche Erweiterungen und Optimierungen am git/Gitlab-basierten Backend von CATMA durchgeführt werden. Dazu zählen eine vereinfachtes Layout der zugrundeliegenden git-Projekte und ihrer Datei- und Ordnerstruktur, eine effiziente Indizierung von Text und Annotationen im Hinblick auf Speicherverbrauch und Performanz sowie ein neuer vereinfachter Kollaborationsmodus für die Analyse gemeinsamer Annotationsergebnisse ohne aufwändige Merge-Prozesse.

LangTec unterstützt das Projekt mit Expertise in Software-Engineering, Java und graphbasierten Datenstrukturen.

Read More
20Dez
Eine Hafenrundfahrt zu Weihnachten

Hamburg hat sich mit Wind und Wellen für unsere Weihnachtsfeier von seiner besten Seite gezeigt. Wir konnten das hautnah erleben, denn wir haben eine Hafenrundfahrt auf der Elbe gemacht! Die Fahrt war dank Wellengang und starkem Wind sehr abenteuerlich und wurde humorvoll von Live-Kommentaren unseres Kapitäns untermalt.

Nachdem wir wieder festen Boden unter den Füßen hatten, durften wir ein weihnachtliches Festessen im Philipps genießen. Es war sehr schön, einmal ohne Bildschirm zusammen Zeit zu verbringen. Ein wirklich schöner Abend mit leckerem Essen, Drinks, toller Atmosphäre und natürlich guten Unterhaltungen. 🙂

Read More
24Nov
LangTec zu Besuch an der Macromedia University

Im Rahmen der Zusammenarbeit mit Prof. Dr. Hestermann im Forschungsprojekt Polizeipressemeldungen besuchen zwei unserer Computerlinguist*innen die Marcomedia University Hamburg mit dem Ziel Studierenden der Journalistik das Fachgebiet der semantischen Textanalyse näherzubringen. Die automatisierte Verarbeitung großer Datenmengen bietet großes Potenzial für journalistische Projekte, wie im Vortrag beispielhaft am Forschungsprojekt der Polizeipressemeldungen erläutert wird: Um Aussagen über die Herkunft erwähnter Personen in Polizeipresseme ldungen machen zu können, ist die Unterscheidung von Tatverdächtigen und Opfern zentral für die Qualität der Aussagen. Bei der Umsetzung dieser Unterscheidung unterstützen die Studierenden LangTec tatkräftig, indem sie Datensätze annotieren, die im Anschluss genutzt werden, um das maschinelle Klassifikationsmodell zu trainieren. Das Seminar schließt mit einer angeregten Diskussion über Schwierigkeiten und Anforderungen an hochwertige Annotationen und zukünftige Einsatzmöglichkeiten semantischer Textanalysen.

Den Bericht der Marcomedia University gibt es hier zu lesen.

Read More
01Okt
Verlängerung für ADAPI

Unser Forschungsprojekt ADAPI, das wir in Kooperation mit den Fraunhofer-Instituten IDMT und IBMT durchführen, wurde bis Mai 2022 verlängert. Wir sind schon sehr gespannt auf die ersten Ergebnisse der praktischen Tests von ADAPI im Klinikkontext.

Read More
21Sep
Experteninterview für das Wirtschaftsministerium

Das Bundeswirtschaftsministerium fördert langfristig die Digitalisierung der deutschen Wirtschaft (Entwicklung und Messung der Digitalisierung der Wirtschaft am Standort Deutschland). Ein spezieller Fokus liegt auf der Künstlichen Intelligenz als wichtiger Enabler der zukünftigen wirtschaftlichen Entwicklung. Zu den Herausforderungen und Lösungsansätzen auf diesem Gebiet werden unter anderem Workshops und Öffentlichkeitsarbeit organisiert, aber auch Interviews mit Fachexperten geführt.

Die Schwerpunktthemen wechseln dabei jährlich, und in 2021 ist die Anwendung von NLP-Technologie im Fokus. Als positives Beispiel wurde dazu auch LangTec ausgewählt und in einem mehrstündigen Video-Interview befragt. In einem ausführlichen Frage- und Antwort-Prozess ging es dabei u.a. um typische Anwendungsgebiete für NLP-Anwendungen, erreichbare Präzision, IT-Voraussetzungen, Betriebsarten und Plattformen, Weiterbildung und natürlich um den Datenschutz.

Gerne haben wir zum Verständnis des sehr dynamischen Geschäftsfeldes NLP bei den Entscheidungsträgern beigetragen. Auch für uns war dies eine einmalige Gelegenheit, die Praxis unseres Kernbereichs Semantic Text Processing einmal in aller Ausführlichkeit an interessierte Forscher zu vermitteln. Die Ergebnisse aller Interviews werden Ende 2021 Jahres als Fallstudie veröffentlicht.

Read More
23Aug
Wissenschaftlicher Besuch bei LangTec: Forschungsaufenthalt zweier Linguistik-Professorinnen

In dieser Woche sind die beiden Linguistik-Professorinnen Prof. Dr. Bettina Migge (University College Dublin) und Prof. Dr. Britta Schneider (Europa-Universität Viadrina Frankfurt (Oder)) zu Gast in den Räumlichkeiten von LangTec, um sich mit uns umfassend über computerlinguistische und textanalytische Methodiken in der Anwendung auszutauschen. Prof. Dr. Migge und Prof. Dr. Schneider leiten gemeinsam die Arbeitsgruppe „Ideologies, Beliefs, Attitudes“ im Forschungsnetzwerk LITHME (Language In The Human-Machine Era). Mit unseren Kolleginnen und Kollegen diskutierten sie in einer Vielzahl spannender und inspirierender Gespräche LangTecs Projektarbeiten sowie mögliche Schnittmengen zwischen akademischer Linguistik und der angewandten Sprachtechnologie in der Industrie.

Read More
01Aug
Forschungsprojekt ‘Analyse von Polizeipressemeldungen’

Nicht nur ein Fall für die Polizei! Journalistikprofessor Dr. Thomas Hestermann der Macromedia Hochschule in Hamburg untersucht mit seinem Forscher*innenteam den Umgang der Polizei mit der Herkunft von Tatverdächtigen in einem Corpus aus deutschen Polizeipressemeldungen, die in dem Zeitraum von 2014 bis 2018 veröffentlicht wurden. Die Zuordnung von Herkunftsbezeichungen, sowie die Unterscheidung von Tatverdächtigen und Opfern ist hierbei zentral für die Qualität der Ergebnisse des Forschungsprojekts und bei einer quantitativ angelegten Untersuchung nicht mit einer einfachen Stichwortsuche oder Kollokationsanalyse lösbar. Untersucht werden sollen 1,6 Millionen Polizeipressemeldungen mit über 15,7 Millionen Sätzen.

LangTec unterstützt das Forschungsprojekt daher mit Expertise in semantischer Textanalyse. Konkret kommen Verfahren zum Einsatz, die es ermöglichen, in den Berichten Tatverdächtige eindeutig zu identifizieren und diese von Opfern zu unterscheiden. So können die Zeichenfolgen für die Bezeichnungen von Tatverdächtigen und Opfern zwar gleich sein, aber die semantischen Unterschiede lasssen sich über die unterschiedlichen Tiefenstrukturen erkennen.

Read More
 
Top