Neuronale maschinelle Übersetzung: was Sie wissen müssen

Von

Wir haben wahrscheinlich alle schon einmal Tools wie Google Translate Reverso oder Deepl verwendet. Das sind Übersetzungstools im Internet, mit denen Texte von einer Sprache in eine andere übertragen werden können. Diesen Vorgang bezeichnet man als maschinelle Übersetzung oder Machine Translation (MT) auf Englisch: die Übertragung eines Textes von einer Sprache in eine andere durch einen Computer ohne menschliches Zutun.

Manche dieser Programme lassen hinsichtlich der Qualität der Übersetzungen noch sehr zu wünschen übrig, weshalb sich unter anderem folgende Fragen stellen: Wird ein generisches Programm zur maschinellen Übersetzung meinen spezifischen Business-Anforderungen gerecht? Wird bei der Machine Translation die Vertraulichkeit meiner Daten garantiert? Was ist die neuronale maschinelle Übersetzung und wie kann ich Sie in meinen individuellen Workflow integrieren?

Maschinelle Übersetzung: Ursprung, Funktionsweise und Entwicklung

Die Anfänge der maschinellen Übersetzung gehen in die 50er-Jahre zurück. Bisher gab es drei Arten von Systemen:

Die regelbasierten Systeme (1980er-Jahre)

Das maschinelle Übersetzungsprogramm verknüpft Wörterbücher mit gängigen Begriffen sowie linguistische und grammatikalische Regeln. Es wird außerdem empfohlen, benutzerspezifische Wörterbücher hinzuzufügen, um die Qualität der Übersetzung zu verbessern. Trotzdem erfüllt die Qualität bei dieser Art der maschinellen Übersetzung die Erwartungen der Nutzer nicht immer. Nichtsdestotrotz ermöglichen regelbasierte Systeme dank der Einpeisung von Fachwörterbüchern im Normalfall kohärente und logische Übersetzungen.

Statistikbasierte Systeme (1980–1990)

Diese Systeme verwenden für den Übersetzungsvorgang keinerlei linguistische Regeln. Sie übersetzen mithilfe von statistischen Modellen, die automatisch anhand von Korpora erstellt werden. Das maschinelle Übersetzungsprogramm analysiert wichtige Datenbanken für jede Sprache, was sehr fließende Übersetzungen ermöglicht, die allerdings manchmal nicht sehr logisch sind.

Auf neuronalen Algorithmen basierende Systeme (2015)

Mit diesen Systemen kann in Echtzeit übersetzt und die Wahrscheinlichkeit einer Wortabfalge vorausgesagt werden. Es handelt sich um einen Ansatz, der es Programmen ermöglicht, mittels neuronalen Netzen, deren Verknüpfungen denen eines Gehirns ähnlich sind, das Übersetzen zu erlernen. Dieses System der neuronalen maschinellen Übersetzung liefert Übersetzungen von höherer Qualität: die neuronale Übersetzung enthält 50 % weniger Fehler bei der Wortstellung, 17 % weniger lexikalische Fehler und 19 % weniger grammatikalische Fehler. Die neuronalen Netze haben sogar gelernt, Geschlecht und Fall in verschiedenen Sprachen korrekt abzustimmen (obwohl ihnen das niemand beigebracht hat!). Hier sehen Sie als Beispiel einen Satz auf Englisch, der zuerst von einem generischen maschinellen Übersetzungsprogramm und dann von einem lernfähigen maschinellen Übersetzungsprogramm ins Deutsche übersetzt wurde.

Neuronale-maschinelle-uebersetzung-beispiel

 


Finden Sie heraus, wie Sie dank moderner Technologien Produktinformationen internationalisieren können


Die NMT – ein großer Vorteil für die maschinelle Übersetzung

Die Neural Machine Translation arbeitet nach einem ganz anderen Prinzip als andere Ansätze wie etwa die statistikbasierte oder die regelbasierte maschinelle Übersetzung. Die NMT verwendet ein großes neuronales Netz, das mithilfe künstlicher Intelligenz nach dem Modell des menschlichen Gehirns funktioniert.

Es ist die fortschrittlichste Methode computergenerierter Übersetzungen und hat dank selbstständigen Lernens auf der Grundlage von künstlicher Intelligenz, Big Data und Deep Learning in den letzten Jahren enorme Fortschritte gemacht. Heutzutage können neuronale Programme maschineller Übersetzung als Basis für professionelle Übersetzungen eingesetzt werden.

Das Programm kann sowohl akkurate Übersetzungen generieren als auch eine Sprache lernen. Dadurch wird die Qualität der übersetzten Daten kontinuierlich verbessert. Damit die NMT gut funktioniert, muss sie unbedingt von einem Menschen trainiert werden. Das bedeutet, dass das Programm mit einer großen Menge an Daten gespeist werden muss, um die Zuverlässigkeit der Endergebnisse zu verbessern.

Der Mensch kann das Programm außerdem so trainieren, dass es die spezifischen Bedürfnisse einzelner Sektoren wie etwa dem Justiz-, Finanz- oder Medizinbereich, die alle ein eigenes Fachvokabular verwenden, erfüllt.

Zwei Unternehmen der GAFAM haben diese Art der überprüften maschinellen Übersetzung bereits integriert:

  • Google mit Google Neural Machine Translation (GNMT): ein in 8 Sprachen verfügbares neuronales Netz
  • Microsoft mit der App Microsoft Translator: Dokumente können in mehr als 60 verschiedene Sprachen übersetzt werden

Skype verfügt über seinen Skype Translator, mit dem Gruppenunterhaltungen mit bis zu 100 Teilnehmenden ermöglicht werden.

Die NMT ist also in zahlreichen Bereichen nützlich, vor allem im E-Commerce. Damit zufriedenstellende Ergebnisse erzielt werden können, ist es jedoch wichtig, dass einige Kriterien erfüllt sind: Es braucht eine ausreichende Anzahl von Wiederholungen, ein hinlängliches Volumen spezifischer Daten, um das Programm entsprechend zu trainieren, sowie eine große Menge an Texten zum Übersetzen.

Allerdings gibt es auch einige Aspekte, die nicht übersehen werden dürfen …

Die Grenzen der neuronalen maschinellen Übersetzung

Ein Nachteil der NMT wie auch der anderen Arten von maschineller Übersetzung ist, dass die Sätze im Ausgangstext ganz eindeutig sein müssen, um eine qualitätsvolle Übersetzung zu erhalten. Die kleinste Zweideutigkeit muss schon im Voraus in das Programm integriert werden, weil sonst das Risiko besteht, dass Übersetzungen ohne jeglichen Sinn generiert werden. Die neuronale maschinelle Übersetzung kommt bei einer sehr technischen Sprache oder bei der Verwendung von seltenen Wörtern oder Eigennamen schnell an ihre Grenzen. Deshalb muss man vor dem Einsatz von neuronaler maschineller Übersetzung einige Punkte beachten:

  • Die Eindeutigkeit des zu übersetzenden Textes, um Probleme mit mehrdeutigen Wörtern oder Sätzen zu vermeiden
  • Das Training und der menschliche Blickwinkel auf die spezifischen Sektoren (rechtlich, medizinisch, …)
  • Die Gewährleistung der Vertraulichkeit der Daten: Man muss sich der Tatsache bewusst sein, dass die öffentlich verfügbaren Programme alle eingegebenen Daten auf ihren Servern speichern. Aus diesem Grund ist es schwierig beziehungsweise unmöglich, die Geheimhaltung der Kundendaten zu garantieren.
  • Der Aspekt der Kreativität: ein Programm lernt sehr schnell, was als Norm gilt, und schlägt dann immer eine Übersetzung vor, die seiner Einschätzung und seinem Wissensstand nach die passendste ist. Bei Markensprachen (vor allem im E-Commerce-Bereich) muss man sich jedoch möglichst klar von der Konkurrenz unterscheiden (ein „Top“ bei Topshop wird bei Zara vielleicht „T-Shirt“ genannt, obwohl sich beide Produkte auf das gleiche Kleidungsstück beziehen).

Um diese Hürden zu bewältigen, ist die menschliche Interaktion unumgänglich.

Die Notwendigkeit menschlichen Zutuns

Die maschinelle Übersetzung – selbst die neuronale – weist also nach wie vor einige Schwachstellen auf, insbesondere was den Kontext angeht. Deswegen führt an der Überprüfung durch einen Menschen kein Weg vorbei, denn bestimmte sprachliche Feinheiten können von der maschinellen Übersetzung einfach nicht erfasst werden. Die menschliche Expertise beim Projektmanagement sowie Ratschläge und technische Kenntnisse von Fachpersonen auf dem Gebiet der Neural Machine Translation sind demnach unverzichtbare Bestandteile, um ein überprüftes maschinelles Übersetzungsprojekt zum Erfolg zu führen.

All dies bringt uns zur überprüften maschinellen Übersetzung oder lektorierten maschinellen Übersetzung. Man nennt diese Vorgangsweise Post-Edited Machine Translation oder PEMT. Darunter versteht man, dass professionelle Übersetzer, die mit den Herausforderungen der neuronalen maschinellen Übersetzung vertraut sind, die von der Maschine generierten Übersetzungen korrigieren, um einen Zieltext anzufertigen, der kohärent ist und sich natürlich liest. Es gibt zwei Arten von Post-Editing:

  • Das einfache Post-Editing, bei dem die maschinelle Übersetzung nur oberflächlich korrigiert wird
  • Das umfassende Post-Editing, bei dem eine ausführliche und gründliche Korrektur vorgenommen wird

Die einfache PEMT eignet sich für folgende Fehler: Rechtschreib- oder Grammatikfehler, inhaltliche Fehler, unpassende oder beleidigende Inhalte, fehlende Wörter… Bei der umfassenden PEMT hingegen werden zum Beispiel die Terminologie, die Struktur bestimmter Sätze, die Zeichensetzung oder der Schreibstil korrigiert, um den Text natürlicher und fließender zu machen.

Die einfache PEMT (light post-editing auf Englisch) wird also eingesetzt, um eine Sprache, die man nicht beherrscht, grundlegend verstehen zu können, während die umfassende PEMT (full post-editing auf Englisch) verwendet wird, wenn die vom Übersetzungsprogramm generierten Sätze wirklich rundum perfektioniert werden sollen. Daher kommt auch die Bezeichnung überprüfte oder lektorierte maschinelle Übersetzung.

Die neuronale maschinelle Übersetzung stellt also einen bemerkenswerten Fortschritt hinsichtlich der Effizienz und der Brauchbarkeit maschineller Übersetzungsprogramme dar. Diese Programme sind – wenn sie für eine spezifische Branche mit Daten gespeist und trainiert werden – eine qualitätsvolle Basis für die Übersetzer, die mit dem Gegenlesen und Korrigieren der übersetzten Texte beauftragt sind. Die NMT bietet Unternehmen wichtige Vorteile:

  • Erstens lassen sich durch die maschinelle Übersetzung große finanzielle Einsparungen erzielen.
  • Zweitens ergibt sich eine bedeutende Zeitersparnis: ein professioneller menschlicher Übersetzer kann pro Tag durchschnittlich 2.000 bis 3.000 Wörter übersetzen, wohingegen eine Maschine nur einen Augenblick braucht, um das gleiche Volumen zu übersetzen.
  • Schließlich wird dank der menschlichen Expertise des zuständigen Teams und dank der unverzichtbaren Arbeit der professionellen Übersetzer, die mit dem Post-Editing betraut sind, eine Übersetzung von höchster Qualität gewährleistet.

Die Arbeit von neuronalen maschinellen Übersetzungsprogrammen muss daher unbedingt mit menschlichem Fachwissen kombiniert werden. Hier sind Profis aus dem Übersetzungsbereich gefragt: Projektmanager, Linguisten, Entwickler und Übersetzer/Korrekturleser. Die überprüfte maschinelle Übersetzung ermöglicht schnelle, kohärente und kostengünstigere Übersetzungen, die auf Ihr Fachgebiet, Ihre Markensprache und Ihr Zielpublikum zugeschnitten sind.

Best Practices zur Übersetzung und Lokalisierung der Website

Das könnte Ihnen auch gefallen
Expertenmeinungen