Beiträge in der Kategorie: News
10Feb
Parser für Schifffahrtskunden

Um den Abrechnungsprozess zwischen Hafenmeister und Reedereien zu erleichtern entwickelt LangTec mit Expertenwissen in NLP für einen Schifffahrtskunden aus Südostasien einen maßgeschneiderten Parser für Dokumente mit kaufmännischen, technischen, Verwaltungs- und Sicherheits-Informationen zu Tankschiffen. Zu den verarbeitenden Dokumenten zählen standardisierte Fragebögen „Questionnaire 88“ und Harbor Timesheets mit Input in den einer Reihe von Inputformaten wie Text, Bild oder Website. Durch Information Ingestion, Parsing, Analytik, Normalisierung sowie Disambiguierung von prozessrelevanten Daten wird unsere Lösung realisiert und als eine REST-konformer Webservice bereitgestellt.

Read More
21Jan
Erweiterung und Optimierung der Annotations- und Analysesoftware CATMA

Die Annotations- und Analysesoftware CATMA ist eine der Kernkomponenten des BMBF-geförderten Forschungsprojektes forTEXT der TU Darmstadt. Im Rahmen von forTEXT sollen umfangreiche Erweiterungen und Optimierungen am git/Gitlab-basierten Backend von CATMA durchgeführt werden. Dazu zählen eine vereinfachtes Layout der zugrundeliegenden git-Projekte und ihrer Datei- und Ordnerstruktur, eine effiziente Indizierung von Text und Annotationen im Hinblick auf Speicherverbrauch und Performanz sowie ein neuer vereinfachter Kollaborationsmodus für die Analyse gemeinsamer Annotationsergebnisse ohne aufwändige Merge-Prozesse.

LangTec unterstützt das Projekt mit Expertise in Software-Engineering, Java und graphbasierten Datenstrukturen.

Read More
20Dez
Eine Hafenrundfahrt zu Weihnachten

Hamburg hat sich mit Wind und Wellen für unsere Weihnachtsfeier von seiner besten Seite gezeigt. Wir konnten das hautnah erleben, denn wir haben eine Hafenrundfahrt auf der Elbe gemacht! Die Fahrt war dank Wellengang und starkem Wind sehr abenteuerlich und wurde humorvoll von Live-Kommentaren unseres Kapitäns untermalt.

Nachdem wir wieder festen Boden unter den Füßen hatten, durften wir ein weihnachtliches Festessen im Philipps genießen. Es war sehr schön, einmal ohne Bildschirm zusammen Zeit zu verbringen. Ein wirklich schöner Abend mit leckerem Essen, Drinks, toller Atmosphäre und natürlich guten Unterhaltungen. 🙂

Read More
24Nov
LangTec zu Besuch an der Macromedia University

Im Rahmen der Zusammenarbeit mit Prof. Dr. Hestermann im Forschungsprojekt Polizeipressemeldungen besuchen zwei unserer Computerlinguist*innen die Marcomedia University Hamburg mit dem Ziel Studierenden der Journalistik das Fachgebiet der semantischen Textanalyse näherzubringen. Die automatisierte Verarbeitung großer Datenmengen bietet großes Potenzial für journalistische Projekte, wie im Vortrag beispielhaft am Forschungsprojekt der Polizeipressemeldungen erläutert wird: Um Aussagen über die Herkunft erwähnter Personen in Polizeipresseme ldungen machen zu können, ist die Unterscheidung von Tatverdächtigen und Opfern zentral für die Qualität der Aussagen. Bei der Umsetzung dieser Unterscheidung unterstützen die Studierenden LangTec tatkräftig, indem sie Datensätze annotieren, die im Anschluss genutzt werden, um das maschinelle Klassifikationsmodell zu trainieren. Das Seminar schließt mit einer angeregten Diskussion über Schwierigkeiten und Anforderungen an hochwertige Annotationen und zukünftige Einsatzmöglichkeiten semantischer Textanalysen.

Den Bericht der Marcomedia University gibt es hier zu lesen.

Read More
01Okt
Verlängerung für ADAPI

Unser Forschungsprojekt ADAPI, das wir in Kooperation mit den Fraunhofer-Instituten IDMT und IBMT durchführen, wurde bis Mai 2022 verlängert. Wir sind schon sehr gespannt auf die ersten Ergebnisse der praktischen Tests von ADAPI im Klinikkontext.

Read More
21Sep
Experteninterview für das Wirtschaftsministerium

Das Bundeswirtschaftsministerium fördert langfristig die Digitalisierung der deutschen Wirtschaft (Entwicklung und Messung der Digitalisierung der Wirtschaft am Standort Deutschland). Ein spezieller Fokus liegt auf der Künstlichen Intelligenz als wichtiger Enabler der zukünftigen wirtschaftlichen Entwicklung. Zu den Herausforderungen und Lösungsansätzen auf diesem Gebiet werden unter anderem Workshops und Öffentlichkeitsarbeit organisiert, aber auch Interviews mit Fachexperten geführt.

Die Schwerpunktthemen wechseln dabei jährlich, und in 2021 ist die Anwendung von NLP-Technologie im Fokus. Als positives Beispiel wurde dazu auch LangTec ausgewählt und in einem mehrstündigen Video-Interview befragt. In einem ausführlichen Frage- und Antwort-Prozess ging es dabei u.a. um typische Anwendungsgebiete für NLP-Anwendungen, erreichbare Präzision, IT-Voraussetzungen, Betriebsarten und Plattformen, Weiterbildung und natürlich um den Datenschutz.

Gerne haben wir zum Verständnis des sehr dynamischen Geschäftsfeldes NLP bei den Entscheidungsträgern beigetragen. Auch für uns war dies eine einmalige Gelegenheit, die Praxis unseres Kernbereichs Semantic Text Processing einmal in aller Ausführlichkeit an interessierte Forscher zu vermitteln. Die Ergebnisse aller Interviews werden Ende 2021 Jahres als Fallstudie veröffentlicht.

Read More
23Aug
Wissenschaftlicher Besuch bei LangTec: Forschungsaufenthalt zweier Linguistik-Professorinnen

In dieser Woche sind die beiden Linguistik-Professorinnen Prof. Dr. Bettina Migge (University College Dublin) und Prof. Dr. Britta Schneider (Europa-Universität Viadrina Frankfurt (Oder)) zu Gast in den Räumlichkeiten von LangTec, um sich mit uns umfassend über computerlinguistische und textanalytische Methodiken in der Anwendung auszutauschen. Prof. Dr. Migge und Prof. Dr. Schneider leiten gemeinsam die Arbeitsgruppe „Ideologies, Beliefs, Attitudes“ im Forschungsnetzwerk LITHME (Language In The Human-Machine Era). Mit unseren Kolleginnen und Kollegen diskutierten sie in einer Vielzahl spannender und inspirierender Gespräche LangTecs Projektarbeiten sowie mögliche Schnittmengen zwischen akademischer Linguistik und der angewandten Sprachtechnologie in der Industrie.

Read More
01Aug
Forschungsprojekt ‘Analyse von Polizeipressemeldungen’

Nicht nur ein Fall für die Polizei! Journalistikprofessor Dr. Thomas Hestermann der Macromedia Hochschule in Hamburg untersucht mit seinem Forscher*innenteam den Umgang der Polizei mit der Herkunft von Tatverdächtigen in einem Corpus aus deutschen Polizeipressemeldungen, die in dem Zeitraum von 2014 bis 2018 veröffentlicht wurden. Die Zuordnung von Herkunftsbezeichungen, sowie die Unterscheidung von Tatverdächtigen und Opfern ist hierbei zentral für die Qualität der Ergebnisse des Forschungsprojekts und bei einer quantitativ angelegten Untersuchung nicht mit einer einfachen Stichwortsuche oder Kollokationsanalyse lösbar. Untersucht werden sollen 1,6 Millionen Polizeipressemeldungen mit über 15,7 Millionen Sätzen.

LangTec unterstützt das Forschungsprojekt daher mit Expertise in semantischer Textanalyse. Konkret kommen Verfahren zum Einsatz, die es ermöglichen, in den Berichten Tatverdächtige eindeutig zu identifizieren und diese von Opfern zu unterscheiden. So können die Zeichenfolgen für die Bezeichnungen von Tatverdächtigen und Opfern zwar gleich sein, aber die semantischen Unterschiede lasssen sich über die unterschiedlichen Tiefenstrukturen erkennen.

Read More
15Jul
Development-Support in der digitalen Augmentierung von Fernsehübertragungen

Microservice-Architekturen ermöglichen die erfolgreiche Umsetzung komplexer Software-Systeme durch modularisierte, heterogene Softwarekomponenten.

In diesem neu beauftragten Projekt unterstützt LangTec einen der führenden Anbieter in der Augmentierung und Personalisierung von Fernsehübertragungen mit digitalen Inhalten. LangTecs Beitrag besteht dabei in der Bereitstellung von Expertise in der Entwicklung von Microservices in Java und Python sowie in der Verbesserung und funktionalen Erweiterung der Backend-Infrastruktur.

Read More
01Jul
Neuer Kunde: Das Wirtschaftsmagazin brand eins

Das Wirtschaftsmagazin brand eins will seinen Lesern systematisch die archivierten Artikel früherer Jahrgänge zugänglich machen. Dazu müssen die über 10.000 Texte nicht nur rein chronologisch, sondern vor allem auch nach inhaltlichen Kriterien auffindbar und zugreifbar gemacht werden. Bislang besteht bereits eine redaktionell erarbeitete inhaltliche Zielstruktur, aber noch keine Zuordnung der Texte in diese Struktur. In der automatisierten Erstellung genau dieser Zuordnung soll LangTec mit textanalytischen Methoden unterstützen.

Ziel des Vorhabens ist es, die Texte in einer n:m-Zuordnung zu den thematischen Kategorien zuzuordnen. Dabei sollen zu jedem Text sowohl die Inhaltskategorien als auch die Stärke der Assoziation der jeweiligen Zuordnung angegeben werden. LangTec wird die Zuordnung mit Hilfe von Machine Learning automatisieren. Eine zentrale Herausforderung dabei wird sein, das Vorgehen so zu wählen, dass auch ohne das Vorliegen von gelabelten Daten eine vollständige Indexierung aller Texte ohne zusätzliche redaktionelle Arbeit erzielt werden kann.

Read More
Top