機械翻訳比べ

今朝BBCのニュースサイトを読んでいたところ、ビジネス ミニスターの Paul Scully 氏から、「NHSのアプリから10日間の自主隔離要請の警告を受け取った場合は、その指示に従って欲しい。しかし隔離は法的な強制ではなく、あくまでも推奨。なので携帯に(ピン!と言う)警告が届いた場合は雇用者(上司)に聞くなどして自分たちで判断して欲しい」と言った内容のアナウンスがあったと書いてありました。

そうなるとほとんどの人が「違法でなければやらなくてもいいわけね」と隔離を無視してしまう可能性が出たため、その数時間後には首相官邸が、「いやいやそうではなくて自主隔離はちゃんとやってください、雇用者も被雇用者から相談を受けた場合は、隔離をさせ、サポートをしてあげてください。隔離は非常に重要です」と、まるで反対の声明を発表しました。

さて、このBBCの記事を今日のブログに書こうとまとめていて、2ヶ所行き詰まりました。business minister“informed decision”をうまく日本語で表現できなかったのです。そこで、機械翻訳にかけてみることにしました。(普段ブログを書く時は使わないのですが…。)

機械翻訳、と言うとGoogle翻訳を思い浮かべる人が多く、すでにGoogleの翻訳機能を試した方も多いと思います。以前に比べるとたくさん学習したらしく、だいぶまともに訳してくれて本当に便利になりました。でもここ数年はドイツの会社が開発したDeepLの方が優秀だと言うことで利用者も増えてきたようです。そこで試しに記事から一部を抜粋して、両方に翻訳してもらいました。

抜粋した記事は以下になります。

It comes after confusion was caused by business minister Paul Scully saying he would encourage people who are “pinged” to self-isolate but they can make an “informed decision” - from: https://www.bbc.co.uk/news/live/uk-57898328

結果Google翻訳では以下に訳されていました。

それは、ビジネス大臣のポール・スカリーが、「ping」されている人々に自己隔離を奨励すると言って混乱を引き起こした後ですが、彼らは「情報に基づいた決定」を下すことができます

うーん、よくわからない日本語。

DeepLでは以下でした。

ポール・スカリー経済相が、”ping “を受けた人には “情報に基づいた判断 “ができるように自己隔離することを勧めると発言したことで、混乱が生じました。

こちらの方がスラスラと読めますが、なんだか意味が違っています。「自己隔離をするのは、情報に基づいた判断ができるようになるため」ではなく、「自己隔離するか否かは情報に基づいた判断で」と言ってるはずです。そしてその「自分たちで判断していいよ」と言ってることが混乱を引き起こしたのではなかったかと。そこで、今度はもう一回この訳された日本語を同じDeepL翻訳機にかけたところ、以下になりました。

Confusion arose when the economy minister, Paul Scully, said he would recommend that people who had been “pinged” self-isolate so that they could make “informed decisions”.

オリジナルの英語と全く違った文章が表示されました。まるで機械も混乱しているよう?ビジネス ミニスターもいつも間にやらエコノミー ミニスターになっています。機械翻訳、100%信用するのはちょっと危険かもしれないですね。

ただ今回は、あれ?と言う結果になってしまいましたが普段は優秀なDeepL、もう一つ大きなメリットがあって、それは「翻訳機にかけた文章は暗号化して一時的にRAM(作業用のメインな記憶装置)にアップロードされるけれど、翻訳後は削除されてどこにも残らない」と言うことです。一方、他の機械翻訳はデータを蓄積して精度を高めているので、個人情報でもなんでもサーバに残ってしまうと言われています。

ドイツはヨーロッパの中でも一番GDPR(EU一般データ保護規則)の厳しい国だと言われています。その面からもこのドイツ生まれのDeepLは安心ですね。

とは言っても会社の機密情報などは無料の翻訳機にはかけず、どうしても必要な時は会社名や重要な単語は削除するなり他の言葉に置き換えるなどした方がより安全ではないかと思います。

(追記:この後、前後の記事もまとめてDeepLに翻訳してもらったところ、今度はほぼ的確な訳になっていました。やはりDeepLがオススメです。)

コメント新規追加