昨今の機械翻訳の進化に伴い、翻訳会社の顧客の間でも、時間と費用の両面でコスト削減が期待できる機械翻訳導入への要望が高まっているとのことで、先日、機械翻訳の導入を検討する機会をいただきました。いま話題になっているNMTについてはウェブ上でも情報がたくさん得られるので、ここでは、個人的な機械翻訳体験の経緯と感想をごく簡単にメモしておくだけにしようと思います。
NMTについては少しずつ情報収集や意見交換を行ってはいましたが、身近に押し寄せてくるのはまだまだ先だろうと思っていたので、真剣さに欠けていました。今回、機械翻訳導入を検討することになり、やっとはじめて、無料で使用できるNMT(みらい翻訳、Google翻訳など)でどのような訳文が生成されるのかを試してみました。
無料で使用できるNMTの訳文は、全体として逐語的であるだけでなく、前後関係や理論的なつながりの欠如、選択される訳語の誤りや表記の揺れ等、問題点もかなり多く、ポストエディットで通常の翻訳時と同等の品質を確保することは新規に翻訳するよりも大変な作業のように思われました。翻訳会社には、NMTのアウトプットに対する率直な感想と併せて、機械翻訳のポストエディットは翻訳とは異なる作業だと考えている旨を伝え、機械翻訳導入の目的や作業方法について、さらに詳しく説明していただきました。
いろいろと不安はありましたが、翻訳会社のご尽力による検証とご判断を信頼したい気持ちもあり、やってみないことには判断のしようもないので、機械翻訳を使用する練習案件を実際にやってみることにしました。練習案件は1000ワードにも満たないミニ案件で、納期は自分で設定、お支払いは、翻訳会社が予定している課金率を適用したもの(通常の翻訳料よりわずかに低単価)でした。
機械翻訳は現段階でも、原文の意味を理解して翻訳しているわけではないので、翻訳者が内容を理解して作成する訳文とはかなり異なっているように思いました。このため、機械翻訳のアウトプットを修正していくのではなく、通常の翻訳を行いつつ機械翻訳のアウトプットの使える部分を利用するようにしました。このミニ案件の作業中に感じたのは、下記の4点です。
■「Google翻訳」や「みらい翻訳」などの無料で使えるNMTに比べると、訳文は比較的流暢で読みやすく、適切な訳語が選択されていることが多い。
■"XX including A, B, and C"が、実際は「Aを含むXX、BおよびC」であるのに「A、B、Cを含むXX」と訳出されている等、内容が理解できていないと判断が難しい箇所では誤訳がみられる。
■入力の手間が省けるという点で少しだけ作業が効率化。
■出力された訳文が比較的流暢なだけに、内容を理解した上で翻訳にあたらないと、誤訳を見逃してしまう危険がおおいにある。
参考:
下記の記事はとても簡潔でよくまとまっています。機械翻訳についてほとんど何も知らない、という方は是非ご一読ください。
【機械翻訳の現状と対処法(バベル翻訳大学院(USA)小室 誠一)】

にほんブログ村
スポンサーサイト