【2024年決定版】機械翻訳の正しい使い方
追記 2024/10/07
機械翻訳の正しい使い方をまとめた講座をUdemyで公開しました。本記事の内容を下地として、より細かいポイントまで体系的にまとめていますので、機械翻訳を使いこなしたいという方、翻訳のリテラシーを高めたいという方は是非ご参考頂ければ幸いです。
2024年現在までで、身近に用いられるAIは大きな進化を遂げました。現在はAI関連はいわゆる『幻滅期』に入っているとされる向きもあり、「AIと言っても、思ったほどじゃないな」という評価が幅を利かせている状態、あるいはAIの進化に市場が飽食気味である常体と言えるかと思います。
そこで、ある程度AIの成長が一服した現状を鑑みて、2024年現在、「翻訳で困ったときにどのように(ChatGPT や Claude、Gemini などの)生成AIを含む機械翻訳サービスを使って行けば良いか」ということを、翻訳家の視点からまとめます。
ちなみに ChatGPT(ChatGPT4 および ChatGPT4-o)や、Claude 3、Gemini などの生成AIの翻訳のクオリティについての詳細は DeepL と比較した記事がありますので、よろしければそちらもご覧ください。この記事では、Lancers(ランサーズ)や Crowdworks(クラウドワークス)といったクラウドソーシングサービスの翻訳家に依頼した場合との比較検証も行っています。
加えて、そもそも「どういうときに機械翻訳を使うべきか」という使用判断基準についてまとめた記事もございますので、こちらも合わせてご参考ください。
本記事では、「実際に使うときにどのように使うべきか、またどの機械翻訳サービスを使うべきか」ということについて細かくまとめます。主には日英・英日翻訳での使用を想定していますが、他の言語ペアにも応用できるはずです。
以下、関連記事のまとめとなります。
結論: DeepL を使うべし
大雑把に意味を取りたい場合や、多少間違っていても良いから機械翻訳を使いたいというよう大体のニーズにおいては、DeepL を使うのがオススメです。結局、どの機械翻訳や生成AIを使っても、精度の部分は根本的には解決しません。すると、機械翻訳に求めるのは(精度や表現の機微を犠牲にした)速さであるということになります。この場合、使いやすいし動作も安定しているという点で、DeepL を使うのが大抵最も良いと言えます。
特に DeepL のページでダウンロードできるデスクトップ版のアプリを使うと、ショートカットで翻訳箇所を直接翻訳したり、翻訳内容を自動挿入したりできるので便利です。一々プロンプトを打たなくても良いし、ページを開く必要もないため、ぜひアプリ版の DeepL を使ってみてもらえればと思います。
ただし、DeepL で翻訳に使用したテキストは学習に利用されることがあります。そのため、業務などで使う場合(機密保持の必要がある情報などの翻訳の場合)には、有料版に登録し、学習データとして利用されないようにする必要があります。
DeepL翻訳の精度を少しでも高めるには
『AI翻訳革命』という本の中では、『機械翻訳の精度は90%程度』と言われています。この精度は、昨今の技術革新によって多少は向上しているかもしれませんが、個人的な肌感では上がっていても1〜3%程度のような感があります(しかし、それだけ上がることは技術的にはとても凄い進歩です)。
一方、人間があるテキストを読んで理解するためには、分からない箇所が全体の少なくとも4%以下でなければいけないとされています。言い換えれば、全体の96%が問題なく分かるようでなければ、テキストの理解に支障が出るということです。
仮に90%の精度があったとしても、10%の間違いが含まれると、テキストを結果として誤読してしまう可能性が非常に高くなります。また、この4%以下なら「分からなくても何とかなる可能性がある」というのは、「分からない部分」であり、誤訳による誤情報が含まれていればそれだけ原文を誤解する可能性は高くなるでしょう。
本来であれば、そうしたエラーを解消する上では高い精度(加えて適切な表現)が期待できる翻訳家に依頼するのが最も安全ですが、機械翻訳を使う上で精度を高める上でもできることがあります。
ひとつには、「一文ずつ翻訳する」ということです。つまり、テキストをまるごと翻訳したり、データごと翻訳したりするのではなく、一文ずつ翻訳していきます。特にパワーポイントなどの翻訳の場合、文脈が図解によるサポートで成り立っていたり、省略語が使われていたりするため、誤訳が起こりやすく、ひとつずつ確認していくのが確実です。
また、ウェブサイトなどを翻訳する Chrome の拡張機能などもありますが、これも参考程度にするなら問題はない一方、例えば資料として引用したい場合や、表現の機微が重要な内容(例えばインタビュー記事、政治的な内容、専門性の高い内容など)であれば、一文ずつ翻訳する方が確実です。
DeepL で英日翻訳の精度を上げるには
英日翻訳で少しでも精度を上げるには、複雑な文は単文にします。特に DeepL はセミコロンやコロンは苦手なので注意が必要です。意味が変わらないように正確に単文にするのが難しいと感じる場合、必要に応じて翻訳家などの専門家に相談しましょう。
また、一文ずつ翻訳したり、短文にしたりすることによって、訳出された日本語は拙くなったり、文の繋がりが悪くなったりすることに注意です。そのほか、これは複雑な文の文構造の取り違えを少なくするためのやり方であり、それぞれの文の精度が高いかどうかは分からない点にも留意してください。
DeepL で日英翻訳の精度を上げるには
日英翻訳で少しでも精度を上げるには、原文を英語の語順に近づけたり、省略されている表現をすべて補うようにします。英語と日本語だと、日本語の方が省略されていたり、冠詞など文法的に英文から消えてしまうものの方が多いため、日本語から英語に翻訳する際には、それが自動的に補われることになります。
その際、補うべき語を間違えてしまったり、あるいは適切に補われなかったりすることがあります。このようなエラーを避けるため、日本語の時点で英文の構造に近い状態にすることが求められます。
DeepL の用語集について
DeepL では用語集を登録でき、特定の用語を特定のワードで翻訳させることができます。例えば社名など、固有名詞の訳語を固定するのに便利です。ただし、動詞や一般名詞の場合には文脈によって翻訳を変える方が自然なことが多いので、用いない方が良いケースもあります。
ちなみに用語集は、DeepL の無料版と有料版で登録可能数が異なります。
その他注意事項
機械翻訳した結果の精度を確認する上で、『逆翻訳』をするのが有効であるとされる場合もあります。これは、例えば日本語から英語に翻訳した後、その英語をまた日本語に同じく DeepL で翻訳することで、意味が変わっていないかを確認する、というものです。
ただしこれは、翻訳を2度繰り返しているということになり、それぞれの翻訳の時点で誤訳が発生し得るということでもあります。仮に一度の翻訳の誤訳率が10%なら、日英・英日と連続で翻訳して少なくとも1度誤訳が発生する確率は、単純計算で19%になります。実際には単純な翻訳であればそこまで悪いことにはならないかと思いますが、機械翻訳を繰り返せば、誤訳が発生する確率は上がることは確かです。
また、SEO記事などの特殊な原文を翻訳する場合には、単純な翻訳では用を為さないことが多いと言えます。例えばSEOの場合、海外向けのSEOキーワードを調査し、それを適用する必要があります。
その他、ぱっと見で日本語的に自然なテキストであっても、それが原文に対して正確であるかどうかとは無関係であるという点にも注意が必要です。特に DeepL は自然な日本語にしようとして訳抜けを起こしたりすることも多く、訳文が自然であればあるほど、そのエラーを見つけにくくなるという問題もあります。
最終的には DeepL の翻訳が適切であるかどうかを必ず人間の目で判断する必要があり、この判断ができないと、あくまで自己責任でその翻訳を用いる必要が生じます。
そのため、翻訳の妥当性が判断できる人材にダブルチェックを依頼するのが良いでしょう。その結果によっては、翻訳のし直しが発生することもあるかもしれません。この判断ができる人物とは、原文をそのまま読むことができ、原文の意味を正確に捉えることができる人材のことで、多くの場合は高い英語力を持つ人材か、翻訳者が該当することになります。
ChatGPT や Claude、Gemini などの生成AIの併用
DeepL の翻訳結果が、原文に対して明らかに不安がある場合もあるはずです。例えば原文に対して明らかに訳出された文字数が少ない、何となく原文を流し読みした感じで受ける「言っていること」と訳文の言っていることが異なる、などの場合です。
こういう場合には、もちろん専門家に確認をさせるのが最も確実ではありますが、ChatGPT や Claude、Gemini などの生成AIに翻訳をさせて、その結果をセカンドオピニオンとして参考にする方法もあります。
プロンプトは単純に「以下を英語/日本語に翻訳してください。」と入力して英文などを入れるだけでもOKですが、「直訳で翻訳してください」のように指示すれば、意訳を試みた結果としての訳抜けを避けられるかもしれません。
このとき、「〜するな」というネガティブプロンプトよりも、「〜してください」という肯定文でのプロンプトの方が上手くいくとされることも多いので、「訳抜けはしないでください」と指示をするよりも、「直訳で翻訳してください」と指示をする方が安定する向きがありそうです。
もちろんそれでも誤訳は起こりますし、訳抜けも発生し得ます。しかしその場合でも、DeepL が見落としたかもしれない訳抜けを発見できるかもしれません。
仮にDeepLの翻訳と生成AIの翻訳が異なる場合、どちらの翻訳がより適切であるのかを判断し、適切な方を使うことになります。その判断の仕方は、DeepL 自体の翻訳結果の判断をするときと同じです。
生成AIでの翻訳の注意点
DeepL で翻訳をする場合、短期間で同じ翻訳をすれば基本的には同じ翻訳結果になります。しかし ChatGPT や Claude などの生成AIの場合、原文をプロンプトの一部としてテキストを生成するというような処理をしている可能性があり、連続で同じプロンプトによって翻訳をさせても、翻訳結果は毎回異なります。その意味で、「たまたまハズレを引く」というようなこともある点には注意です。
また、生成AIを用いる場合であっても、プロンプトが学習データに用いられることがあるので、必要に応じて学習データに用いられないように設定をするといった対策が必要です。
翻訳業界と機械翻訳
最後に、簡単に翻訳業界での機械翻訳の扱いについて言及しておきます。
大前提として、世の中には翻訳しなければいけないテキストが無数にあります。そのため、大手の翻訳会社でも、大量の翻訳を短期間で捌くために機械翻訳をプロセスの中に取り入れて効率的に翻訳をしようとすることも珍しくありません。
もちろんこれ自体は、成果物のクオリティとのバランスが取れていれば問題のあることではありません。しかし、機械翻訳の割合が大きく人間の翻訳者の手直しが少ないか、または人間の翻訳者の手直しのプロセス(MTPEのプロセス)に負荷が掛かっていることもあります。このことは、翻訳内容のクオリティを著しく下げることにも繋がります。
また、Lancers や Crowdworks といったクラウドソーシングサービスの台頭により、翻訳家を名乗るためのハードルは著しく下がりました。これは市場に様々な翻訳者が増えたという意味では、選択肢が増えたということでもあり、良い面もあります。しかし一方、(翻訳業界に限った話ではないはずですが)残念ながら実力が充分でないまま翻訳者として活動することになっているフリーランスもやはり存在します。
したがって、「機械翻訳ではなく人間の翻訳者に依頼したい」という場合(SEO翻訳やトランスクリエーション、ローカリゼーションなど)、それが可能な、信頼できる個人の翻訳者を見つけて依頼することが最も確実なのが現状であるように思います。
以上が、2024年現在のおおよその機械翻訳の使い方です。別の記事でも言及している通り、本来は機械翻訳を最も効率的に使えるのは「機械翻訳を使わなくても英語が読める人」であり、そういった人材の『効率化』のために機械翻訳があるという位置づけです。そのため、ここに書いてある『精度を高める方法』などはあくまで次善策であり、慎重な翻訳が必要である場合には、機械翻訳そのものの使用にも慎重にならなければなりません。
ちなみに、機械翻訳の結果が日本語・英語的に正しい場合であっても、事実関係が間違っているという場合もあります。その際にはファクトチェックや実際のエビデンスの調査を行う必要があります。
そして調査の結果、翻訳結果との相違が確認された場合、原文が間違っているか、機械翻訳の際に誤訳が発生しているか、調査した資料が間違っているかのいずれかということになります。翻訳自体は正しく、原文か資料のどちらかが間違っている場合には追加のファクトチェックが必要になるでしょう。
プロの翻訳家の場合、こうした調査やファクトチェックも同時に行いますので、そういった面で困った場合にもプロに依頼すると安心という面もあります。
しかし、それほどではないと判断できる場合、または機械翻訳を使って翻訳しても妥当だと考えられるような場合には、本記事のようなことを意識して頂けると少し役立つのではないかと思います。特に DeepL のデスクトップアプリは非常に使いやすいので、普段から翻訳が必要な人はぜひ使ってみて頂ければと思います。