Skip to content
H. von BargenMai 2025

Wie LLMs die Übersetzungsbranche verändern | Interview (2025)

Die Übersetzungsbranche erlebt derzeit einen tiefgreifenden Wandel, angetrieben durch eine Technologie, die in allen Bereichen der Sprachverarbeitung neue Maßstäbe setzt: Large Language Models (LLMs). In diesem Experteninterview mit Jourik Ciesielski, einem führenden Spezialisten für Sprachtechnologie, erfahren Sie, was diese Modelle ausmacht und warum sie die Art und Weise revolutionieren, wie wir übersetzen.

Jourik Ciesielski

Unser Experte: Jourik Ciesielski

Jourik Ciesielski ist CTO bei Yamagata Europe und Gründer von C-Jay International. Mit einem Masterabschluss in Übersetzung sowie einem postgradualen Zertifikat in Fachübersetzung ist er ein anerkannter Experte für Sprachtechnologie.

Sein Fokus liegt auf maschineller Übersetzung, Large Language Models, audiovisueller Übersetzung und Translation Management Systemen. Durch sein tiefes Verständnis beider Welten – Übersetzung und Technologie – ist er ein idealer Gesprächspartner zum Thema LLMs in der Übersetzungsbranche.

Besuchen Sie seine Website

Was sind Large Language Models?

Large Language Models (LLMs) sind hochentwickelte neuronale Netzwerke, die auf enormen Mengen von Sprachdaten trainiert werden. Im Gegensatz zu herkömmlichen maschinellen Übersetzungssystemen (MT) beschränken sich LLMs nicht auf eine einzige Aufgabe, sondern können eine Vielzahl von sprachbezogenen Aufgaben bewältigen.

Ein Large Language Model ist ein neuronales Netzwerk, das auf sehr großen Mengen von Sprachdaten trainiert wird. Während des Trainingsprozesses lernt es, sprachliche Muster und Beziehungen in den Trainingsdaten zu erkennen und erzeugt im Produktionseinsatz kontextuell relevante Antworten, indem es die wahrscheinlichste Ausgabe auf der Grundlage einer gegebenen Eingabe vorhersagt.

Jourik Ciesielski, CTO bei Yamagata Europe und Gründer von C-Jay International

Wie Ciesielski erklärt, unterscheidet LLMs von den in der Übersetzungsbranche typischerweise verwendeten Sprachmodellen (z. B. maschinellen Übersetzungsmodellen, Text-to-Speech-Modellen) unter anderem folgende Eigenschaften:

  • Sie können neben Text auch Bilder, Sprache und Videos verarbeiten
  • Sie sind nicht aufgabenspezifisch, können aber für bestimmte Aufgaben optimiert werden
  • Sie können durch natürlichsprachliche Anweisungen für bestimmte Aufgaben trainiert werden – ein Prozess, der als Prompting bezeichnet wird

Der Unterschied zu traditionellen maschinellen Übersetzungssystemen

Merkmal Traditionelle MT LLM-basierte Übersetzung
Anpassbarkeit

Um traditionelle MT-Systeme zu trainieren, braucht man eine große Menge an parallelen Textkorpora in den zu übersetzenden Sprachpaaren. Diese müssen sorgfältig aligniert und bereinigt werden. Wenn das MT-System für bestimmte Fachgebiete eingesetzt werden soll, muss der Trainingsdatensatz auch repräsentativ sein und entsprechende Fachterminologie und typische Formulierungen enthalten. Das Training von traditionellen MT-Engines kann also sehr zeitaufwändig sein.

Beim Prompting von LLMs hingegen kann man oft auf bereits vortrainierte Modelle zurückgreifen und diese mit gezielten Anweisungen für die jeweilige Übersetzungsaufgabe anpassen, ohne unbedingt einen speziellen repräsentativen Datensatz erstellen zu müssen.  So kann die Übersetzung schnell und flexibel an die jeweiligen Bedürfnisse der Nutzer angepasst werden.

Kreativität Niedrig, wortgetreue Übersetzungen. Traditionelle MT-Systeme sind typischerweise auf möglichst genaue Übersetzungen trainiert, was z.B. im Marketing oft nicht ideal ist Hoch, natürlichere Formulierungen. Beispielsweise ist im Marketingbereich die Flexibilität von LLM mit Prompting oft vorteilhafter, da sie nicht nur übersetzen, sondern den Inhalt auch kreativ an die Zielkultur anpassen können.
Multifunktionalität Nur Übersetzung Übersetzung, QA, Post-Editing usw.

Anwendungsfälle von LLMs in der Übersetzungsbranche

Die Einsatzmöglichkeiten von LLMs in der Übersetzungsbranche sind vielfältig und werden ständig erweitert. Ciesielski identifiziert drei Hauptanwendungsfälle, die bereits produktionsreif sind:

  1. Automatische Übersetzungen mit Stilrichtlinien und Glossaren.
  2. Automatisiertes Post-Editing bestehender Übersetzungen anhand von Stilrichtlinien und Glossaren.
  3. Automatische Qualitätssicherung (QA) anhand von Stilrichtlinien und Glossaren.
Hier unten beschreiben wir für euch die Vorteile, die diese drei spannende Anwendungsfälle mit sich bringen:

 

1

Automatisierte Übersetzung mit Stilrichtlinien und Glossaren

Wenn man Stilrichtlinien und Glossare als Prompts verwendet, können LLMs Übersetzungen erzeugen, die nicht nur inhaltlich korrekt sind, sondern auch stilistische Vorgaben und spezifische Terminologie berücksichtigen. Dies ist besonders wertvoll für Marketingmaterialien, die häufig zielgruppengerechte Übersetzungen erfordern. Beispielsweise kann das LLM aufgefordert werden, eine geschlechtsneutrale Sprache oder einen informellen Stil zu verwenden.

Vorteile für Unternehmen im E-Commerce und Marketing: Gezielte Markenbotschaften in verschiedenen Sprachen ohne Qualitätsverlust, schnellere Time-to-Market für internationale Kampagnen, höhere Conversion-Raten durch kulturell angepasste Inhalte.

2

Automatisiertes Post-Editing bestehender Übersetzungen anhand von Stilrichtlinien und Glossaren.

Bei technischen Dokumentationen, bei denen die herkömmliche maschinelle Übersetzung bereits zufriedenstellende Ergebnisse liefert, können LLMs durch entsprechende Prompts für gezielte Verbesserungen, insbesondere zur Erhöhung der terminologischen Konsistenz, eingesetzt werden.

Vorteile für prozessorientierte Organisationen: Kürzere Bearbeitungszeiten, Qualitätssteigerung bei gleichzeitiger allgemeiner Kostensenkung.

3

Automatisierte Qualitätssicherung (QA)

Herkömmliche QA-Prüfungen in Translation Management Systemen (TMS), wie Trados und MemoQ erzeugen oft eine große Anzahl falscher positiver und falscher negativer Ergebnisse. Übersetzer und Projektmanager müssen sich häufig durch Hunderte falscher positiver Ergebnisse kämpfen, in der Hoffnung, einen einzigen echten Fehler zu finden. LLMs können durch ihr Kontextverständnis und ihre Anpassungsfähigkeit diese Prozesse erheblich verbessern.

Vorteile für LSPs und Unternehmen in regulierten Branchen: Präzisere Erkennung kritischer Fehler, transparente und nachvollziehbare Qualitätskontrolle für hohe Compliance-Anforderungen.

Ich glaube fest an den dritten Anwendungsfall, die Qualitätssicherung, da ich denke, dass die Neugestaltung der QA eine hohe Priorität für unsere Branche hat. QA-Prüfungen in TMS erzeugen typischerweise eine große Anzahl falscher positiver und falscher negativer Ergebnisse.

Jourik Ciesielski über das Potenzial von LLMs in der Qualitätssicherung

Grenzen und Herausforderungen

Trotz ihres enormen Potenzials sind LLMs kein Allheilmittel. Ciesielski weist auf einige wichtige Einschränkungen hin:

  1. Missverständnisse und überhöhte Erwartungen: Wenn ich mit Kunden oder Kollegen über LLMs spreche, muss ich oft betonen, dass LLMs nicht (direkt) in der Lage sind, DTP-Arbeiten durchzuführen oder PDF-Dokumente zu modifizieren, erklärt Ciesielski.
  2. Halluzinationen: LLMs können manchmal vollständig falsche Ausgaben produzieren. Diese sogenannten Halluzinationen werden mit der Weiterentwicklung der Technologie voraussichtlich seltener, stellen aber derzeit noch ein ernsthaftes Problem dar.
  3. Nicht für alle Inhaltstypen optimal: Wie Ciesielski erklärt: Bestimmte Arten von Inhalten profitieren immer noch mehr von traditionellen MT-Systemen. [...] Die traditionelle maschinelle Übersetzung ist immer noch die beste Wahl für Inhalte wie technische Dokumente, weil die Übersetzungen normalerweise echt nah am Original sind und nicht so kreativ.

Fallbeispiel: Technische Dokumentation eines Maschinenbauunternehmens

Ein mittelständischer Maschinenbauer aus Deutschland nutzt für seine technische Dokumentation eine Kombination aus traditioneller MT und LLM-basiertem Post-Editing. Die MT-Engine liefert präzise, quelltextnahe Übersetzungen technischer Begriffe und Anweisungen, während das LLM anschließend die Lesbarkeit verbessert und konsistente Terminologie sicherstellt. Dieser hybride Ansatz reduzierte den manuellen Nachbearbeitungsaufwand um 38 % und beschleunigte die Markteinführung neuer Produkte in internationalen Märkten signifikant.

Dokumentenbasierte LLM-Übersetzung in TMS-Systemen: Ein innovativer Ansatz

Ein besonders vielversprechender Ansatz zur Überwindung der Einschränkungen traditioneller MT-Systeme innerhalb von TMS-Systemen wie MemoQ oder Trados ist die dokumentenbasierte LLM-Übersetzung. Ciesielski hat einen Prototyp entwickelt, der genau diesen Ansatz verfolgt.

Texte werden i.d.R. in TMS-Systemen segmentiert und in Übersetzungseinheiten unterteilt. Dies zielt darauf ab, die zweisprachige Bearbeitung komplexer Dokumente zu erleichtern und sie effektiver mit dem Inhalt von Translation Memories und Glossaren abzugleichen. Die Segmentierung unterstützt die Konsistenz bei wiederholten Textpassagen und ermöglicht eine strukturierte Qualitätskontrolle. Das kann aber auch eine Einschränkung für die Bearbeitung durch MT-Engines darstellen. Das Problem bei maschineller Übersetzung in TMS-Systemen ist, dass Dokumente auf Satz-für-Satz-Basis verarbeitet werden. Jeder Satz wird an die MT-Engine geschickt und dabei aus seinem textuellen Kontext gerissen – genau dem Kontext, den ein Sprachmodell für erstklassige Ergebnisse benötigt. Der Prototyp von Ciesielski adressiert dieses Problem.

Das Problem bei maschineller Übersetzung in TMS-Systemen ist, dass Dokumente auf Satz-für-Satz-Basis verarbeitet werden. Jeder Satz wird aus seinem textuellen Kontext gerissen – genau dem Kontext, den ein Sprachmodell für erstklassige Ergebnisse benötigt. Der Prototyp von Ciesielski adressiert dieses Problem.

Der Prototyp liest XLIFF-Dateien im TMS-System, identifiziert die übersetzbaren Einheiten (mit Ausnahme vollständiger Translation-Memory-Matches), bearbeitet diese Einheiten als einen zusammenhängenden Text und übersetzt dann den Quelltext in einem Durchgang mit einem LLM. Wenn das LLM den übersetzten Text zurückgibt, wird er wieder segmentiert, und jeder übersetzte Satz wird seiner entsprechenden Übersetzungseinheit in der XLIFF-Datei zugeordnet. Die Übersetzer können nun wie gewohnt eingreifen und wo notwendig die Übersetzungseinheiten bearbeiten. Der entscheidende Vorteil besteht darin, dass sie auf der Grundlage einer qualitativ hochwertigeren maschinellen Übersetzung arbeiten können. 

Wie Ciesielski erklärt, bietet dieser Ansatz mehrere entscheidende Vorteile:

  • Das Modell VERSTEHT die Beziehung zwischen den Sätzen (während es bei begrenztem Kontext nur VORHERSAGT)
  • Dadurch trifft es die richtigen grammatikalischen und semantischen Entscheidungen, auch bei kontextarmen Präpositionen, Referenzen usw.
  • Probleme mit schlechter Segmentierung lösen sich von selbst
  • Der API-Overhead wird reduziert, da ein Dokument mit einem einzigen API-Aufruf übersetzt wird
  • Das Framework liefert segmentierte Ausgaben, was die volle Kompatibilität mit Translation Memories gewährleistet

Die Auswirkungen auf die Übersetzungsbranche

Die Integration von LLMs in den Übersetzungsprozess hat weitreichende Auswirkungen auf die gesamte Branche. Für Sprachdienstleister (LSPs) eröffnen sich neue Möglichkeiten, ihre Dienstleistungen zu verbessern und zu erweitern. Übersetzer können sich auf kreativere und anspruchsvollere Aspekte des Übersetzungsprozesses konzentrieren, während repetitive Aufgaben zunehmend automatisiert werden.

Ich glaube aufrichtig, dass LLMs das Potenzial haben, viele Aspekte traditioneller Übersetzungsprozesse zu revolutionieren, von der automatisierten Übersetzung bis hin zur Qualitätssicherung und dem Workflow-Management. [...] Die universelle Natur [von LLMs] erfordert, dass Einzelpersonen ihre eigenen Anwendungsfälle entwickeln, was wiederum neue Fähigkeiten, optimierte Prozesse und maßgeschneiderte Integrationen erfordert.

Jourik Ciesielski über die Auswirkungen von LLMs auf die Übersetzungsbranche

Bereit für die Zukunft der Übersetzungstechnologie?

Bei tolingo integrieren wir fortschrittliche Technologien wie LLMs in unsere Übersetzungslösungen, um Ihren speziellen Anforderungen gerecht zu werden. Erfahren Sie, wie LLM-basierte Übersetzungen Ihre internationalen Projekte auf das nächste Level heben können.

Kostenlose Beratung vereinbaren

Fazit

Large Language Models revolutionieren die Übersetzungsbranche durch ihr tiefes Kontextverständnis, ihre Flexibilität und ihre Fähigkeit, menschenähnliche Texte zu generieren. Die dokumentenbasierte LLM-Übersetzung von Jourik Ciesielski stellt einen besonders vielversprechenden Ansatz dar, um die Einschränkungen traditioneller maschineller Übersetzungssysteme in herkömmlichen TMS-Systemen zu überwinden.

Während LLMs bestehende Übersetzungsprozesse optimieren, bleiben sie ein Werkzeug, das menschliche Expertise ergänzt, nicht ersetzt. Die erfolgreiche Integration dieser Technologie erfordert neue Fähigkeiten, angepasste Prozesse und ein tiefes Verständnis der jeweiligen Stärken und Schwächen.

Glossar wichtiger Begriffe

LLM (Large Language Model)
Ein neuronales Netzwerk, das auf sehr großen Mengen von Sprachdaten trainiert wird und kontextuell relevante Antworten generieren kann.
Prompting
Die Praxis, einem LLM natürlichsprachliche Anweisungen zu geben, um bestimmte Aufgaben zu erfüllen oder spezifische Ausgaben zu erzeugen.
Halluzination
Das Phänomen, dass LLMs manchmal Inhalte generieren, die faktisch falsch oder erfunden sind, obwohl sie überzeugend präsentiert werden.
XLIFF (XML Localization Interchange File Format)
Ein XML-basiertes Format für den Austausch von lokalisierbaren Daten zwischen verschiedenen Übersetzungstools.
RAG (Retrieval-Augmented Generation)
Eine Methode, bei der ein LLM Informationen aus externen Quellen abruft, um genauere und fundiertere Antworten zu generieren.

Verwandte Artikel