Maschinelle Übersetzung

Einsatz von maschineller Übersetzung an der JGU

Die Möglichkeiten maschineller Übersetzung haben sich in den letzten Jahren rasant weiterentwickelt. Online verfügbare maschinelle Übersetzungssysteme produzieren heute flüssige Übersetzungen. Trotzdem sollte maschinelle Übersetzung mit Bedacht eingesetzt werden, denn sie eignet sich nicht für alle Texte und benötigt oft eine Korrektur durch Übersetzer:innen. Zudem ist es wichtig, den Datenschutz im Blick zu haben.

Wie funktioniert maschinelle Übersetzung?

Bei einer maschinellen Übersetzung wird ein Text ohne menschliches Zutun von der einen in die andere Sprache übertragen. Schon seit langem versuchen sich Wissenschaftler:innen mit verschiedensten Methoden an diesem Thema, aber erst mit der neuronalen maschinellen Übersetzung gelang der Durchbruch: Mithilfe selbstlernender Algorithmen, großer Datenmengen und riesiger Rechnerkapazitäten werden maschinelle Übersetzungssysteme trainiert und lernen dazu. Zwei der bekanntesten maschinellen Übersetzungssysteme sind DeepL und Google Translate.

Was ist der Unterschied zwischen maschineller Übersetzung und einem CAT-Tool?

CAT steht für computer-assisted translation – ein CAT-Tool unterstützt also den Übersetzungsprozess, übersetzt aber nicht selbst. Mithilfe eines CAT-Tools können Übersetzungen verschiedenster Dateiformate erstellt, bearbeitet und verwaltet werden. Die im CAT-Tool angefertigten Übersetzungen werden auf Satzebene in einem Translation Memory gespeichert und für spätere Übersetzungen gleicher oder ähnlicher Passagen wieder vorgeschlagen. Zusätzlich kann eine Termbank, also eine Datenbank zur Speicherung von Fachterminologie, integriert und während des Übersetzungsprozesses erweitert werden. In der Termbank definierte Benennungen werden während der Übersetzung vorgeschlagen.

Zusätzlich lassen sich weitere Hilfsmittel wie (Online-)Wörterbücher oder auch maschinelle Übersetzung einbinden. Hier lässt sich einstellen, ob der Text vorübersetzt oder ob die maschinelle Übersetzung lediglich als Hilfe angezeigt werden soll.

Vorteile von CAT-Tools:

  • Kein Satz wird zweimal übersetzt
  • Integrierte NMT (Neural Machine Translation)
  • Zeitersparnis, zügige Aktualisierung von Dokumenten
  • Konsistenz durch integrierte Termbank
  • Bereits angefertigte Übersetzungen können durch ‚Alignment‘ Funktion nutzbar gemacht werden

Was ist Post-Editing?

Post-Editing bezeichnet die Nachbearbeitung maschinell erstellter Übersetzungstexte durch professionelle Übersetzer:innen. Diese müssen auf andere Fehlerquellen achten als beim Korrigieren menschlicher Übersetzungen. Denn auch wenn maschinelle Übersetzungen heute grammatikalisch fast immer korrekt sind, so sind beim zweiten Hinsehen oft Bezugsfehler zu erkennen. Auch werden häufig Stilebenen vermischt, deutsche Satzkonstruktionen übernommen und Benennungen nicht konsistent verwendet.

Wofür eignet sich MÜ?

Nicht jeder Text eignet sich gleichermaßen für MÜ. Je nach Fachgebiet, Zielgruppe, Verwendungszweck und Vertraulichkeitsgrad ist daher im Einzelfall zu entscheiden, ob Sie MÜ einsetzen sollten oder nicht.

Reine maschinelle Übersetzung (MT), ohne Post-Editing, eignet sich zum Beispiel sehr gut für Texte zum Eigengebrauch, bei denen grob der Inhalt verstanden werden soll und die nicht vertraulich sind.

Eingesetzt wird maschinelle Übersetzung auch bei Produktbewertungen (z.B. etsy) oder -beschreibungen (airbnb), in Nutzerforen oder für Handbücher (Microsoft). Oft sind die Übersetzungen mit einem entsprechenden Hinweis (Disclaimer) versehen.

Maschinelle Übersetzung mit Post-Editing (MT-PE) eignet sich beispielsweise für interne Mitteilungen mit knappen Fristen.

Humanübersetzung (HT) eignet sich zum Beispiel für vertrauliche Dokumente, sehr anspruchsvolle Texte oder solche, die den Leser emotional und stilistisch ansprechen sollen.

Ob sich Ihr Text für eine maschinelle Übersetzung oder eine maschinelle Übersetzung mit Post-Editing eignet, können Sie mithilfe unserer Entscheidungsmatrix herausfinden.

Weitere Empfehlungen für den Einsatz von MÜ

  • Online-Versionen führender Online-Übersetzer (DeepL, google translate) speichern Texte zu Trainingszwecken. Es dürfen also keine Texte übersetzt werden, die datenschutzrechtlich sensible bzw. personenbezogene Daten enthalten.
  • Sie sollten die Sprache, in die Sie übersetzen lassen möchten, ausreichend gut beherrschen, um Sinnfehler oder Auslassungen zu erkennen und zu verbessern.
  • Gleichen Sie JGU-Eigennamen oder zentrale Begriffe aus dem universitären Bereich mit dem JGU Glossar oder den im Personen- und Einrichtungsverzeichnis hinterlegten Übersetzungen ab.

 

Zum Weiterlesen (Auswahl):

Blog: Translation und Technologie (Hypotheses)

Ottmann, Angelika, and Carmen Canfora. "Risiken und Haftungsfragen bei neuronaler maschineller Übersetzung" Maschinelle Übersetzung für Übersetzungsprofis (2021): 171-184.

Brown et al.: "Language Models Are Few-Shot Learners" (2020).

Popel et al.: "Transforming Machine Translation: A Deep Learning System Reaches News Translation Quality Comparable to Human Professionals" (2020)