機械翻訳システムのGoogle翻訳とDeepLで試訳しました(2020年10月)

英語/翻訳

わたしは今、企業の知的財産部で、日英の特許翻訳の仕事をしています。

8年目です。

自社特許を、外国へ出願するにあたり、その出願種類(明細書や特許請求の範囲)を翻訳する業務です。

とはいえ、実のところ、現在は外注することが多く、翻訳の仕事が少なくなってきました。

外注のほうがコスパがいいというのが理由です。

さらに言うと、現在は、Google翻訳などのニューラル機械翻訳と呼ばれる、ディープラーニングを使ったレベルの高い機械翻訳システムが、更なる進化を続けています。

ドイツのケルンで開発された機械翻訳システムの『DeepL』(ディープ・エル)は、「Google翻訳よりも精度が高い」と言われています。

仕事柄、こうした動向に注目しています。
今日の記事は、機械翻訳について、こんなことを書いています。

 

 機械翻訳サービスのDeepLとGoogle翻訳について
 DeepLとGoogle翻訳の訳文比較(日英翻訳)

 

【新着】FBが英語を介さない機械翻訳モデルを発表

 

まず、翻訳に関して、最新ニュースがありましたので、そちらから。

2020年10月19日、Facebookが、英語を介さず100言語を翻訳する多言語機械翻訳モデルを発表し、オープンソースで公開したそうです。

まとめると、以下の通りです。

・一般的には、英語を中間言語として使用しているが、2言語間での直接翻訳によって、より多くの意味を捉えられ、精度も向上する

・Facebookでは、ニュースフィード上で毎日200億件の翻訳を処理しているが、一般的な機械翻訳システムでは、言語ごと、タスクごとに個別のAIモデルが必要だった。これでは効果的な拡張が不可能

・100種類の言語で75億の文章のペアからなる機械翻訳データセットを構築した

 

 

 

膨大なデータをもとに構築されたシステムが、更に違和感のない翻訳を作っていくわけですね。

翻訳の用語集などを手入力で作っていた昔がなつかしいです…。

機械翻訳システム『DeepL』について

 

 

『DeepL(ディープ・エル)』についてご紹介します。

DeepLは、2017年8月に開始された機械翻訳サービスですが、「Google翻訳よりも精度が高い」との評価もあります。

ちなみに上記のFacebookの新システムと同様、DeepLも、複数の言語間での翻訳を行います。

DeepLについてまとめると以下の通りです。

・ドイツのケルンにあるDeepL社提供
・訳文検索エンジン会社のLingueeが前身
・ウェブサイトで無償提供
・有償プランの『DeepL Pro』では、「文字数制限なし」「文書ファイルをドラッグ&ドロップして丸ごと翻訳」「訳文のカスタマイズ可能」「翻訳完了後にすぐ削除する機密性保持機能あり」

 

有償プランの情報はこちらの通りです。

(出典:DeepL)

Google翻訳について

おそらく皆さんのなじみがあるのは、こちら、『Google翻訳』だと思います。

Googleが提供する、ニューラルネットワーク(脳機能特性を模擬した数理的モデル)にディープラーニングを適用して構築された機械翻訳サービスです。短文や口語表現などでは自然な訳文を作りますが、長文になると訳抜けや文章が成立しないこともあるようです。

DeepLとGoogle翻訳で試訳

 

ここからは、DeepLとGoogle翻訳の訳文を比較します。

今回は、日本語の技術文書に見られる以下の2つの特徴に注目して、比較してみます

 

・一文が長い
・主語が省略される(日本語の特徴)

 

一文が長い

 

技術文書や特許の明細書には、1文が長くなりがちであり、4~5行も続くものもあります。わたしはメカ系の翻訳が多いのですが、青マーカー部分が一文ということもザラです。しかし化学の明細書だと、カタカナや化学式が多いと思いますので、さらに長い文章だと思います。

 

 

上の青マーカーとまではいきませんが、長めの文章を機械翻訳にかけました。

特許の明細書にありそうな文章を作成したものであり、特定の特許明細書ではありません。

 

 DeepL

 

 

日本語では、「流用できるため~」としか書いていませんが 、英語ではthus(したがって)という言葉をはさみ、日本語と同じ長文の一文でありながら、分かりやすく訳出されています。

 

 Google翻訳

 

 

“resulting in(~の結果となる)”を「コストと製造の増加」にかけてしまったので、逆の意味になっています。波線部分からの「これにかかる工数は効果的に抑制することができる」という一文が意味を成しません。

主語が省略される

 

日本語と英語の違いの1つに挙げられるのが「主語の省略」です。そのため、原文をよく理解し、脳内で日本語をリライトしながら、翻訳する必要があります。

 

 DeepL

 

 

実はこの前文に、「コントローラが開閉動作を制御する」という一文があります。

主語が省略されていることを認識し、「(コントローラが)許可すると」の部分は、is allowed(許可されると)と受動態に訳されています。

「(スライドドア2と)車体との間」が原文の意味するところですが、it と訳されています。ここはプレエディット(機械翻訳にかける前に、日本語を編集すること)をするとよさそうです。

 

 Google翻訳

 

 

「これは、ウィンドウ5が開いた状態でスライドドア2の自動での開閉動作を許可すると、ウィンドウガラス4の開口部30から乗員が身体の一部を出していた場合、身体がスライドドア2と車体に挟まれる」と断定した訳になっています。「可能性がある」の部分は、次の一文ですが、文章になっていません。

 

おわりに

 

今回は、日本語の技術文書の

「一文が長い」
「主語が省略される」

という特徴にフォーカスして、DeepLとGoogle翻訳を比較してみました。

今後も、学びを深めるために、技術翻訳についての記事を書いていきたいと思います。

コメント