Beiträge in der Kategorie: News
24Nov
LangTec zu Besuch an der Macromedia University

Im Rahmen der Zusammenarbeit mit Prof. Dr. Hestermann im Forschungsprojekt Polizeipressemeldungen besuchen zwei unserer Computerlinguist*innen die Marcomedia University Hamburg mit dem Ziel Studierenden der Journalistik das Fachgebiet der semantischen Textanalyse näherzubringen. Die automatisierte Verarbeitung großer Datenmengen bietet großes Potenzial für journalistische Projekte, wie im Vortrag beispielhaft am Forschungsprojekt der Polizeipressemeldungen erläutert wird: Um Aussagen über die Herkunft erwähnter Personen in Polizeipresseme ldungen machen zu können, ist die Unterscheidung von Tatverdächtigen und Opfern zentral für die Qualität der Aussagen. Bei der Umsetzung dieser Unterscheidung unterstützen die Studierenden LangTec tatkräftig, indem sie Datensätze annotieren, die im Anschluss genutzt werden, um das maschinelle Klassifikationsmodell zu trainieren. Das Seminar schließt mit einer angeregten Diskussion über Schwierigkeiten und Anforderungen an hochwertige Annotationen und zukünftige Einsatzmöglichkeiten semantischer Textanalysen.

Den Bericht der Marcomedia University gibt es hier zu lesen.

Read More
01Okt
Verlängerung für ADAPI

Unser Forschungsprojekt ADAPI, das wir in Kooperation mit den Fraunhofer-Instituten IDMT und IBMT durchführen, wurde bis Mai 2022 verlängert. Wir sind schon sehr gespannt auf die ersten Ergebnisse der praktischen Tests von ADAPI im Klinikkontext.

Read More
21Sep
Experteninterview für das Wirtschaftsministerium

Das Bundeswirtschaftsministerium fördert langfristig die Digitalisierung der deutschen Wirtschaft (Entwicklung und Messung der Digitalisierung der Wirtschaft am Standort Deutschland). Ein spezieller Fokus liegt auf der Künstlichen Intelligenz als wichtiger Enabler der zukünftigen wirtschaftlichen Entwicklung. Zu den Herausforderungen und Lösungsansätzen auf diesem Gebiet werden unter anderem Workshops und Öffentlichkeitsarbeit organisiert, aber auch Interviews mit Fachexperten geführt.

Die Schwerpunktthemen wechseln dabei jährlich, und in 2021 ist die Anwendung von NLP-Technologie im Fokus. Als positives Beispiel wurde dazu auch LangTec ausgewählt und in einem mehrstündigen Video-Interview befragt. In einem ausführlichen Frage- und Antwort-Prozess ging es dabei u.a. um typische Anwendungsgebiete für NLP-Anwendungen, erreichbare Präzision, IT-Voraussetzungen, Betriebsarten und Plattformen, Weiterbildung und natürlich um den Datenschutz.

Gerne haben wir zum Verständnis des sehr dynamischen Geschäftsfeldes NLP bei den Entscheidungsträgern beigetragen. Auch für uns war dies eine einmalige Gelegenheit, die Praxis unseres Kernbereichs Semantic Text Processing einmal in aller Ausführlichkeit an interessierte Forscher zu vermitteln. Die Ergebnisse aller Interviews werden Ende 2021 Jahres als Fallstudie veröffentlicht.

Read More
23Aug
Wissenschaftlicher Besuch bei LangTec: Forschungsaufenthalt zweier Linguistik-Professorinnen

In dieser Woche sind die beiden Linguistik-Professorinnen Prof. Dr. Bettina Migge (University College Dublin) und Prof. Dr. Britta Schneider (Europa-Universität Viadrina Frankfurt (Oder)) zu Gast in den Räumlichkeiten von LangTec, um sich mit uns umfassend über computerlinguistische und textanalytische Methodiken in der Anwendung auszutauschen. Prof. Dr. Migge und Prof. Dr. Schneider leiten gemeinsam die Arbeitsgruppe „Ideologies, Beliefs, Attitudes“ im Forschungsnetzwerk LITHME (Language In The Human-Machine Era). Mit unseren Kolleginnen und Kollegen diskutierten sie in einer Vielzahl spannender und inspirierender Gespräche LangTecs Projektarbeiten sowie mögliche Schnittmengen zwischen akademischer Linguistik und der angewandten Sprachtechnologie in der Industrie.

Read More
01Aug
Forschungsprojekt ‘Analyse von Polizeipressemeldungen’

Nicht nur ein Fall für die Polizei! Journalistikprofessor Dr. Thomas Hestermann der Macromedia Hochschule in Hamburg untersucht mit seinem Forscher*innenteam den Umgang der Polizei mit der Herkunft von Tatverdächtigen in einem Corpus aus deutschen Polizeipressemeldungen, die in dem Zeitraum von 2014 bis 2018 veröffentlicht wurden. Die Zuordnung von Herkunftsbezeichungen, sowie die Unterscheidung von Tatverdächtigen und Opfern ist hierbei zentral für die Qualität der Ergebnisse des Forschungsprojekts und bei einer quantitativ angelegten Untersuchung nicht mit einer einfachen Stichwortsuche oder Kollokationsanalyse lösbar. Untersucht werden sollen 1,6 Millionen Polizeipressemeldungen mit über 15,7 Millionen Sätzen.

LangTec unterstützt das Forschungsprojekt daher mit Expertise in semantischer Textanalyse. Konkret kommen Verfahren zum Einsatz, die es ermöglichen, in den Berichten Tatverdächtige eindeutig zu identifizieren und diese von Opfern zu unterscheiden. So können die Zeichenfolgen für die Bezeichnungen von Tatverdächtigen und Opfern zwar gleich sein, aber die semantischen Unterschiede lasssen sich über die unterschiedlichen Tiefenstrukturen erkennen.

Read More
15Jul
Development-Support in der digitalen Augmentierung von Fernsehübertragungen

Microservice-Architekturen ermöglichen die erfolgreiche Umsetzung komplexer Software-Systeme durch modularisierte, heterogene Softwarekomponenten.

In diesem neu beauftragten Projekt unterstützt LangTec einen der führenden Anbieter in der Augmentierung und Personalisierung von Fernsehübertragungen mit digitalen Inhalten. LangTecs Beitrag besteht dabei in der Bereitstellung von Expertise in der Entwicklung von Microservices in Java und Python sowie in der Verbesserung und funktionalen Erweiterung der Backend-Infrastruktur.

Read More
01Jul
Neuer Kunde: Das Wirtschaftsmagazin brand eins

Das Wirtschaftsmagazin brand eins will seinen Lesern systematisch die archivierten Artikel früherer Jahrgänge zugänglich machen. Dazu müssen die über 10.000 Texte nicht nur rein chronologisch, sondern vor allem auch nach inhaltlichen Kriterien auffindbar und zugreifbar gemacht werden. Bislang besteht bereits eine redaktionell erarbeitete inhaltliche Zielstruktur, aber noch keine Zuordnung der Texte in diese Struktur. In der automatisierten Erstellung genau dieser Zuordnung soll LangTec mit textanalytischen Methoden unterstützen.

Ziel des Vorhabens ist es, die Texte in einer n:m-Zuordnung zu den thematischen Kategorien zuzuordnen. Dabei sollen zu jedem Text sowohl die Inhaltskategorien als auch die Stärke der Assoziation der jeweiligen Zuordnung angegeben werden. LangTec wird die Zuordnung mit Hilfe von Machine Learning automatisieren. Eine zentrale Herausforderung dabei wird sein, das Vorgehen so zu wählen, dass auch ohne das Vorliegen von gelabelten Daten eine vollständige Indexierung aller Texte ohne zusätzliche redaktionelle Arbeit erzielt werden kann.

Read More
09Jun
Das erste LangTec-Team-Event des Jahres

Endlich konnten wir uns nach Monaten Flex-Office wieder einmal gemeinsam treffen!
Um die Gelegenheit zu feiern, kamen wir alle zum wundervollen Seehaus Hamburg, das direkt an der Alster gelegen ist. Wir genossen das leckere Sushi und die tolle Aussicht auf die Alster. Es war so schön, unsere Kollegen endlich einmal wieder persönlich zu sehen … nicht einmal ein kleiner Regenschauer zwischendurch konnte diese Stimmung trüben 🙂

Read More
17Mai
Herzlich willkommen, Christoper!

Wir freuen uns sehr, das LangTec-Team um ein weiteres tolles Mitglied zu erweitern. Willkommen, Christoper!

Christoper wird uns als Senior Machine Learning Engineer verstärken. Er hat umfangreiche Erfahrung in Software Development, Compute Infrastructure Maintenance und natürlich einen starken akademischen Hintergrund in Machine Leaning. Wir freuen uns auf die Zusammenarbeit und wünschen Dir einen guten Start bei LangTec!

Read More
03Mai
Hey Annika, ahoi!

Toll, dass Du mit an Bord bei uns bist. Wir freuen uns riesig auf die Zusammenarbeit mit Dir und können es kaum abwarten, bis Du auf Deinen ersten Projekten als Computerlinguistin bei uns startest. Für Deinen Projektstart haben wir ein paar spannende Aufgaben für Dich, von der Arbeit mit Dependenzparsern und der Analyse von Syntaxbäumen bis hin zur Integration einer medizinischen Ontologie in eine tiefe Informationsextraktion. Viel Spaß dabei!

Read More
Top