{"id":3400,"date":"2019-05-20T16:14:00","date_gmt":"2019-05-20T14:14:00","guid":{"rendered":"https:\/\/www.textmaster.com\/blog\/neuronale-maschinelle-ubersetzung-was-sie-wissen-mussen\/"},"modified":"2019-05-28T15:28:40","modified_gmt":"2019-05-28T13:28:40","slug":"neuronale-maschinelle-ubersetzung-was-sie-wissen-mussen","status":"publish","type":"post","link":"https:\/\/de.textmaster.com\/blog\/neuronale-maschinelle-ubersetzung-was-sie-wissen-mussen\/","title":{"rendered":"Neuronale maschinelle \u00dcbersetzung: was Sie wissen m\u00fcssen"},"content":{"rendered":"<p>Wir haben wahrscheinlich alle schon einmal Tools wie <strong>Google Translate Reverso<\/strong> oder <strong>Deepl<\/strong> verwendet. Das sind \u00dcbersetzungstools im Internet, mit denen Texte von einer Sprache in eine andere \u00fcbertragen werden k\u00f6nnen. Diesen Vorgang bezeichnet man als <strong>maschinelle \u00dcbersetzung oder Machine Translation<\/strong> (MT) auf Englisch: die \u00dcbertragung eines Textes von einer Sprache in eine andere durch einen <strong>Computer ohne menschliches Zutun<\/strong>.<\/p>\n<p>Manche dieser Programme lassen hinsichtlich der Qualit\u00e4t der \u00dcbersetzungen noch sehr zu w\u00fcnschen \u00fcbrig, weshalb sich unter anderem folgende Fragen stellen: Wird ein generisches Programm zur maschinellen \u00dcbersetzung meinen <strong>spezifischen Business-Anforderungen<\/strong> gerecht? Wird bei der <em>Machine Translation<\/em> die <strong>Vertraulichkeit meiner Daten garantiert<\/strong>? Was ist die neuronale maschinelle \u00dcbersetzung und wie kann ich Sie <strong>in meinen individuellen Workflow integrieren<\/strong>?<\/p>\n<h2><strong>Maschinelle \u00dcbersetzung: Ursprung, Funktionsweise und Entwicklung<\/strong><\/h2>\n<p><a href=\"https:\/\/de.textmaster.com\/blog\/kurze-geschichte-der-uebersetzungstechnologien\/\">Die Anf\u00e4nge der maschinellen \u00dcbersetzung<\/a> gehen in die 50er-Jahre zur\u00fcck. Bisher gab es <strong>drei Arten von Systemen<\/strong>:<\/p>\n<h3><strong>Die regelbasierten Systeme (1980er-Jahre)<\/strong><\/h3>\n<p>Das maschinelle \u00dcbersetzungsprogramm verkn\u00fcpft <strong>W\u00f6rterb\u00fccher mit g\u00e4ngigen Begriffen<\/strong> sowie <strong>linguistische und grammatikalische Regeln<\/strong>. Es wird au\u00dferdem empfohlen, <strong>benutzerspezifische W\u00f6rterb\u00fccher<\/strong> hinzuzuf\u00fcgen, um die Qualit\u00e4t der \u00dcbersetzung zu verbessern. Trotzdem erf\u00fcllt die Qualit\u00e4t bei dieser Art der maschinellen \u00dcbersetzung die Erwartungen der Nutzer nicht immer. Nichtsdestotrotz erm\u00f6glichen regelbasierte Systeme dank der <strong>Einpeisung von Fachw\u00f6rterb\u00fcchern<\/strong> im Normalfall koh\u00e4rente und logische \u00dcbersetzungen.<\/p>\n<h3><strong>Statistikbasierte Systeme (1980\u20131990) <\/strong><\/h3>\n<p>Diese Systeme verwenden f\u00fcr den \u00dcbersetzungsvorgang <strong>keinerlei linguistische Regeln<\/strong>. Sie \u00fcbersetzen mithilfe von <strong>statistischen Modellen<\/strong>, die automatisch anhand von <strong>Korpora<\/strong> erstellt werden. Das maschinelle \u00dcbersetzungsprogramm analysiert wichtige Datenbanken f\u00fcr jede Sprache, was <strong>sehr flie\u00dfende<\/strong> \u00dcbersetzungen erm\u00f6glicht, die allerdings manchmal nicht sehr logisch sind.<\/p>\n<h3><strong>Auf neuronalen Algorithmen basierende Systeme (2015)<\/strong><\/h3>\n<p>Mit diesen Systemen kann <strong>in Echtzeit \u00fcbersetzt<\/strong> und die Wahrscheinlichkeit einer <strong>Wortabfalge<\/strong> <strong>vorausgesagt<\/strong> werden. Es handelt sich um einen Ansatz, der es Programmen erm\u00f6glicht, mittels neuronalen Netzen, deren Verkn\u00fcpfungen denen eines Gehirns \u00e4hnlich sind, das \u00dcbersetzen zu erlernen. Dieses System der neuronalen maschinellen \u00dcbersetzung liefert \u00dcbersetzungen <strong>von h\u00f6herer Qualit\u00e4t<\/strong>: die <strong>neuronale \u00dcbersetzung<\/strong> enth\u00e4lt 50 % weniger Fehler bei der Wortstellung, 17 % weniger lexikalische Fehler und 19 % weniger grammatikalische Fehler<strong>.<\/strong> Die neuronalen Netze haben sogar <strong>gelernt, Geschlecht und Fall in verschiedenen Sprachen korrekt abzustimmen<\/strong> (obwohl ihnen das niemand beigebracht hat!). Hier sehen Sie als Beispiel einen Satz auf Englisch, der zuerst von einem generischen maschinellen \u00dcbersetzungsprogramm und dann von einem lernf\u00e4higen maschinellen \u00dcbersetzungsprogramm ins Deutsche \u00fcbersetzt wurde.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-3416 size-full\" src=\"https:\/\/blog.textmaster.com\/wp-content\/uploads\/2019\/05\/NMT-beispiel.png\" alt=\"Neuronale-maschinelle-uebersetzung-beispiel\" width=\"1668\" height=\"534\" srcset=\"https:\/\/de.textmaster.com\/blog\/wp-content\/uploads\/2019\/05\/NMT-beispiel.png 1668w, https:\/\/de.textmaster.com\/blog\/wp-content\/uploads\/2019\/05\/NMT-beispiel-300x96.png 300w, https:\/\/de.textmaster.com\/blog\/wp-content\/uploads\/2019\/05\/NMT-beispiel-768x246.png 768w, https:\/\/de.textmaster.com\/blog\/wp-content\/uploads\/2019\/05\/NMT-beispiel-1024x328.png 1024w, https:\/\/de.textmaster.com\/blog\/wp-content\/uploads\/2019\/05\/NMT-beispiel-624x200.png 624w\" sizes=\"(max-width: 1668px) 100vw, 1668px\" \/><\/p>\n<p>&nbsp;<\/p>\n<hr \/>\n<p><a href=\"https:\/\/go.textmaster.com\/lp-de-internationalisierung-von-produktinformationen\/?utm_source=blog&amp;utm_medium=referral\">Finden Sie heraus, wie Sie dank moderner Technologien Produktinformationen internationalisieren k\u00f6nnen<\/a><\/p>\n<hr \/>\n<h2><strong>Die NMT \u2013 ein gro\u00dfer Vorteil f\u00fcr die maschinelle \u00dcbersetzung<\/strong><\/h2>\n<p>Die Neural Machine Translation arbeitet nach einem ganz anderen Prinzip als andere Ans\u00e4tze wie etwa die statistikbasierte oder die regelbasierte maschinelle \u00dcbersetzung. Die NMT verwendet <strong>ein gro\u00dfes neuronales Netz, das mithilfe k\u00fcnstlicher Intelligenz nach dem Modell des menschlichen Gehirns funktioniert<\/strong>.<\/p>\n<p>Es ist die fortschrittlichste Methode computergenerierter \u00dcbersetzungen und hat dank selbstst\u00e4ndigen Lernens auf der Grundlage von <strong>k\u00fcnstlicher Intelligenz<\/strong>, <strong>Big Data<\/strong> und <strong>Deep Learning<\/strong> in den letzten Jahren enorme Fortschritte gemacht. Heutzutage k\u00f6nnen neuronale Programme maschineller \u00dcbersetzung als Basis f\u00fcr <strong>professionelle \u00dcbersetzungen<\/strong> eingesetzt werden.<\/p>\n<p>Das Programm kann sowohl <strong>akkurate \u00dcbersetzungen generieren<\/strong> als auch eine Sprache <strong>lernen<\/strong>. Dadurch wird die Qualit\u00e4t der \u00fcbersetzten Daten kontinuierlich verbessert. Damit die NMT gut funktioniert, muss sie unbedingt <strong>von einem Menschen trainiert<\/strong> werden. Das bedeutet, dass das Programm mit einer gro\u00dfen Menge an Daten gespeist werden muss, um die Zuverl\u00e4ssigkeit der Endergebnisse zu verbessern.<\/p>\n<p>Der Mensch kann das Programm au\u00dferdem so trainieren, dass es die spezifischen Bed\u00fcrfnisse einzelner Sektoren wie etwa dem Justiz-, Finanz- oder Medizinbereich, die alle ein <strong>eigenes Fachvokabular<\/strong> verwenden, erf\u00fcllt.<\/p>\n<p>Zwei Unternehmen der <strong>GAFAM<\/strong> haben diese Art der \u00fcberpr\u00fcften maschinellen \u00dcbersetzung bereits integriert:<\/p>\n<ul>\n<li>Google mit Google Neural Machine Translation (GNMT): ein in 8 Sprachen verf\u00fcgbares neuronales Netz<\/li>\n<li>Microsoft mit der App Microsoft Translator: Dokumente k\u00f6nnen in mehr als 60 verschiedene Sprachen \u00fcbersetzt werden<\/li>\n<\/ul>\n<p>Skype verf\u00fcgt \u00fcber seinen Skype Translator, mit dem Gruppenunterhaltungen mit bis zu 100 Teilnehmenden erm\u00f6glicht werden.<\/p>\n<p>Die NMT ist also in zahlreichen Bereichen n\u00fctzlich, vor allem im <strong>E-Commerce<\/strong>. Damit zufriedenstellende Ergebnisse erzielt werden k\u00f6nnen, ist es jedoch wichtig, dass einige Kriterien erf\u00fcllt sind: Es braucht eine ausreichende Anzahl von Wiederholungen, ein hinl\u00e4ngliches Volumen spezifischer Daten, um das Programm entsprechend zu trainieren, sowie eine gro\u00dfe Menge an Texten zum \u00dcbersetzen.<\/p>\n<p>Allerdings gibt es auch einige Aspekte, die nicht \u00fcbersehen werden d\u00fcrfen \u2026<\/p>\n<h3><strong>Die Grenzen der neuronalen maschinellen \u00dcbersetzung<\/strong><\/h3>\n<p>Ein Nachteil der NMT wie auch der anderen Arten von <strong>maschineller \u00dcbersetzung<\/strong> ist, dass die S\u00e4tze im Ausgangstext ganz <strong>eindeutig<\/strong> sein m\u00fcssen, um eine qualit\u00e4tsvolle \u00dcbersetzung zu erhalten. Die kleinste <strong>Zweideutigkeit<\/strong> muss schon im Voraus in das Programm integriert werden, weil sonst das Risiko besteht, dass \u00dcbersetzungen ohne jeglichen Sinn generiert werden. Die <em>neuronale maschinelle \u00dcbersetzung<\/em> <strong>kommt bei einer sehr technischen Sprache oder bei der Verwendung von seltenen W\u00f6rtern oder Eigennamen schnell an ihre Grenzen<\/strong>. Deshalb muss man vor dem Einsatz von <strong>neuronaler maschineller \u00dcbersetzung<\/strong> einige Punkte beachten:<\/p>\n<ul>\n<li><strong>Die Eindeutigkeit des zu \u00fcbersetzenden Textes<\/strong>, um Probleme mit mehrdeutigen W\u00f6rtern oder S\u00e4tzen zu vermeiden<\/li>\n<li><strong>Das Training und der menschliche Blickwinkel<\/strong> auf die spezifischen Sektoren (rechtlich, medizinisch, \u2026)<\/li>\n<li><strong>Die Gew\u00e4hrleistung der Vertraulichkeit der Daten<\/strong>: Man muss sich der Tatsache bewusst sein, dass die \u00f6ffentlich verf\u00fcgbaren Programme alle eingegebenen Daten auf ihren Servern speichern. Aus diesem Grund ist es schwierig beziehungsweise unm\u00f6glich, die Geheimhaltung der Kundendaten zu garantieren.<\/li>\n<li><strong>Der Aspekt der Kreativit\u00e4t<\/strong>: ein Programm lernt sehr schnell, was als Norm gilt, und schl\u00e4gt dann immer eine \u00dcbersetzung vor, die seiner Einsch\u00e4tzung und seinem Wissensstand nach die passendste ist. Bei Markensprachen (vor allem im <strong>E-Commerce<\/strong>-Bereich) muss man sich jedoch m\u00f6glichst klar von der Konkurrenz unterscheiden (ein \u201eTop\u201c bei Topshop wird bei Zara vielleicht \u201eT-Shirt\u201c genannt, obwohl sich beide Produkte auf das gleiche Kleidungsst\u00fcck beziehen).<\/li>\n<\/ul>\n<p>Um diese H\u00fcrden zu bew\u00e4ltigen, ist die <strong>menschliche Interaktion unumg\u00e4nglich<\/strong>.<\/p>\n<h3><strong>Die Notwendigkeit menschlichen Zutuns<\/strong><\/h3>\n<p>Die maschinelle \u00dcbersetzung \u2013 selbst die neuronale \u2013 weist also nach wie vor einige Schwachstellen auf, insbesondere was den Kontext angeht. Deswegen f\u00fchrt an der \u00dcberpr\u00fcfung durch einen Menschen kein Weg vorbei, denn bestimmte sprachliche Feinheiten k\u00f6nnen von der maschinellen \u00dcbersetzung einfach nicht erfasst werden. Die menschliche Expertise beim Projektmanagement sowie Ratschl\u00e4ge und technische Kenntnisse von Fachpersonen auf dem Gebiet der Neural Machine Translation sind demnach unverzichtbare Bestandteile, um ein \u00fcberpr\u00fcftes maschinelles \u00dcbersetzungsprojekt zum Erfolg zu f\u00fchren.<\/p>\n<p>All dies bringt uns zur \u00fcberpr\u00fcften maschinellen \u00dcbersetzung oder lektorierten maschinellen \u00dcbersetzung. Man nennt diese Vorgangsweise <strong>Post-Edited Machine Translation<\/strong> oder <a href=\"https:\/\/fr.textmaster.com\/post-editor-traduction-automatique\/\"><strong>PEMT<\/strong><\/a>. Darunter versteht man, dass professionelle \u00dcbersetzer, die mit den Herausforderungen der <strong>neuronalen maschinellen \u00dcbersetzung<\/strong> vertraut sind, die von der Maschine generierten \u00dcbersetzungen korrigieren, um einen Zieltext anzufertigen, der koh\u00e4rent ist und sich nat\u00fcrlich liest. Es gibt zwei Arten von Post-Editing:<\/p>\n<ul>\n<li><strong>Das einfache Post-Editing<\/strong>, bei dem die maschinelle \u00dcbersetzung nur oberfl\u00e4chlich korrigiert wird<\/li>\n<li><strong>Das umfassende Post-Editing<\/strong>, bei dem eine ausf\u00fchrliche und gr\u00fcndliche Korrektur vorgenommen wird<\/li>\n<\/ul>\n<p>Die einfache PEMT eignet sich f\u00fcr folgende Fehler: <strong>Rechtschreib- oder Grammatikfehler, inhaltliche Fehler, unpassende oder beleidigende Inhalte, fehlende W\u00f6rter<\/strong>\u2026 Bei der umfassenden PEMT hingegen werden zum Beispiel <strong>die Terminologie, die Struktur bestimmter S\u00e4tze, die Zeichensetzung oder der Schreibstil<\/strong> korrigiert, um den Text nat\u00fcrlicher und flie\u00dfender zu machen.<\/p>\n<p>Die einfache PEMT (<em><u>light post-editing<\/u><\/em> auf Englisch) wird also <strong>eingesetzt, um eine Sprache, die man nicht beherrscht, grundlegend verstehen zu k\u00f6nnen<\/strong>, w\u00e4hrend die umfassende PEMT (<em>full post-editing<\/em> auf Englisch) verwendet wird, <strong>wenn die vom \u00dcbersetzungsprogramm generierten S\u00e4tze wirklich rundum perfektioniert werden sollen. Daher kommt auch die Bezeichnung \u00fcberpr\u00fcfte oder lektorierte maschinelle \u00dcbersetzung.<\/strong><\/p>\n<p>Die neuronale maschinelle \u00dcbersetzung stellt also einen <strong>bemerkenswerten Fortschritt hinsichtlich der Effizienz und der Brauchbarkeit maschineller \u00dcbersetzungsprogramme<\/strong> dar. Diese Programme sind \u2013 wenn sie f\u00fcr eine spezifische Branche mit Daten gespeist und trainiert werden \u2013 eine <strong>qualit\u00e4tsvolle Basis f\u00fcr die \u00dcbersetzer<\/strong>, die mit dem Gegenlesen und Korrigieren der \u00fcbersetzten Texte beauftragt sind. Die NMT bietet Unternehmen wichtige Vorteile:<\/p>\n<ul>\n<li>Erstens lassen sich durch die maschinelle \u00dcbersetzung <strong>gro\u00dfe finanzielle Einsparungen<\/strong> erzielen.<\/li>\n<li>Zweitens ergibt sich eine <strong>bedeutende Zeitersparnis<\/strong>: ein professioneller menschlicher \u00dcbersetzer kann pro Tag durchschnittlich 2.000 bis 3.000 W\u00f6rter \u00fcbersetzen, wohingegen eine Maschine nur einen Augenblick braucht, um das gleiche Volumen zu \u00fcbersetzen.<\/li>\n<li>Schlie\u00dflich wird dank der menschlichen Expertise des zust\u00e4ndigen Teams und dank der unverzichtbaren Arbeit der professionellen \u00dcbersetzer, die mit dem Post-Editing betraut sind, eine <strong>\u00dcbersetzung von h\u00f6chster Qualit\u00e4t gew\u00e4hrleistet<\/strong>.<\/li>\n<\/ul>\n<p><strong>Die Arbeit von neuronalen maschinellen \u00dcbersetzungsprogrammen muss daher unbedingt mit menschlichem Fachwissen kombiniert werden<\/strong>. Hier sind Profis aus dem \u00dcbersetzungsbereich gefragt: Projektmanager, Linguisten, Entwickler und \u00dcbersetzer\/Korrekturleser. Die \u00fcberpr\u00fcfte maschinelle \u00dcbersetzung erm\u00f6glicht schnelle, koh\u00e4rente und kosteng\u00fcnstigere \u00dcbersetzungen, die auf Ihr Fachgebiet, Ihre Markensprache und Ihr Zielpublikum zugeschnitten sind.<\/p>\n<p><!--HubSpot Call-to-Action Code --><span id=\"hs-cta-wrapper-7fa8ac3a-1eb2-465d-b5dd-a3862e7481eb\" class=\"hs-cta-wrapper\"><span id=\"hs-cta-7fa8ac3a-1eb2-465d-b5dd-a3862e7481eb\" class=\"hs-cta-node hs-cta-7fa8ac3a-1eb2-465d-b5dd-a3862e7481eb\"><!-- [if lte IE 8]>\n\n\n<div id=\"hs-cta-ie-element\"><\/div>\n\n\n<![endif]--><a href=\"https:\/\/cta-redirect.hubspot.com\/cta\/redirect\/2680086\/7fa8ac3a-1eb2-465d-b5dd-a3862e7481eb\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" id=\"hs-cta-img-7fa8ac3a-1eb2-465d-b5dd-a3862e7481eb\" class=\"hs-cta-img\" style=\"border-width: 0px;\" src=\"https:\/\/no-cache.hubspot.com\/cta\/default\/2680086\/7fa8ac3a-1eb2-465d-b5dd-a3862e7481eb.png\" alt=\"Best Practices zur \u00dcbersetzung und Lokalisierung der Website\" width=\"750\" height=\"200\" \/><\/a><\/span><script charset=\"utf-8\" src=\"https:\/\/js.hscta.net\/cta\/current.js\"><\/script><script type=\"text\/javascript\"> hbspt.cta.load(2680086, '7fa8ac3a-1eb2-465d-b5dd-a3862e7481eb', {}); <\/script><\/span><!-- end HubSpot Call-to-Action Code --><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wir haben wahrscheinlich alle schon einmal Tools wie <strong>Google Translate Reverso<\/strong> oder <strong>Deepl<\/strong> verwendet. Das sind \u00dcbersetzungstools im Internet, mit denen Texte von einer Sprache in eine andere \u00fcbertragen werden k\u00f6nnen. Diesen Vorgang bezeichnet man als <strong>maschinelle \u00dcbersetzung oder Machine Translation<\/strong> (MT) auf Englisch: die \u00dcbertragung eines Textes von einer Sprache in eine andere durch einen <strong>Computer ohne menschliches Zutun<\/strong>.<\/p>\n<p>Manche dieser Programme lassen hinsichtlich der Qualit\u00e4t der \u00dcbersetzungen noch sehr zu w\u00fcnschen \u00fcbrig, weshalb sich unter anderem folgende Fragen stellen: [&#8230;]<\/p>\n","protected":false},"author":22,"featured_media":3418,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[34],"tags":[],"_links":{"self":[{"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/posts\/3400"}],"collection":[{"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/users\/22"}],"replies":[{"embeddable":true,"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/comments?post=3400"}],"version-history":[{"count":8,"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/posts\/3400\/revisions"}],"predecessor-version":[{"id":3429,"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/posts\/3400\/revisions\/3429"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/media\/3418"}],"wp:attachment":[{"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/media?parent=3400"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/categories?post=3400"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/de.textmaster.com\/blog\/wp-json\/wp\/v2\/tags?post=3400"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}