翻訳が機械翻訳で充分かを判断できる指標を作成しました

12月1日

著者 Akitsugu Domoto

2025/05/02 追記

本スケールの、ダウンロード可能なpdfファイルを作成しました。【こちらから】ダウンロード可能です。

2024/10/22 追記

Udemy にて、『機械翻訳を正しく使う方法』を解説した講座を公開しました。その中でも、この下で解説した機械翻訳の利用判断スケールを紹介しています。

また、これを機会として、Udemy の該当部分を引用した動画を YouTube でも公開しています。講座本編の触りとして、または理解の確認として、ご覧頂ければ幸いです。

昨今、DeepL や ChatGPT といった機械翻訳および自動翻訳のツールが一般に使いやすくなり、かつその精度も高まってきています。そのため、翻訳内容によってはこうした機械翻訳ツールを用いるだけでも充分に用を為すということも出てきていることは事実です。

一方、どういうときに機械翻訳を使用して良いのか、またどのような場合には避ける方が良いのかということについては、専門家（翻訳者など）には明らかですが、そうでない場合には分かりにくい面もあります。実際にある翻訳の必要性があるとき、それを翻訳者に外注するべきか、それとも機械翻訳で済ませてしまっても良いかということについて、一目で分かるようなスケールがあると便利そうだと思いました。

そこで試験的に『ある翻訳が機械翻訳で充分かどうかを判断するためのスケール』を作成しました。翻訳しなければいけないものが手元にあるが、機械翻訳で大丈夫かどうか、プロに依頼するべきかどうかなどを判断する場合にご利用ください。DeepL や Google Translate などの自動翻訳ツールだけでなく、ChatGPT などの生成AI経由での翻訳の場合にも当てはまる内容となっています。

本スケールは、10の質問とそれぞれの質問に対する1〜5の評価で機械翻訳の妥当性を予測するものです。以下の質問に回答の後、点数を足して、総合点数と対応する評価を確認してください。

また、質問に対して答えられないという場合、または判断できない場合は、点数は5点で計算してください。

本スケールは、同業他者の意見やフィードバックを参考に今後も改善していく可能性があります。現時点でも、それぞれの設問の内容が同価値であるなど、あくまで参考程度の内容となっております。機械翻訳の使用が適切であるかどうか、詳しく確認したい場合には、お気軽に【お問い合わせ】からご連絡ください。

1: 原文の内容の難しさ

簡単であれば1、難しければ5です。

一文が長い、扱っている内容の抽象度や専門性が高い、テキスト自体が精緻なロジックで成り立っている文であるかどうかなどを判断してください。日英翻訳・英日翻訳のどちらも同じく原文の内容を判断してください。

英日翻訳の場合、利用者本人が原文をそのまま読めるというような場合には、自己チェックが可能になるのでスコアは低くなります。

2: 翻訳に関わる文化性

文化性が低ければ1、高ければ5です。

原文を理解する上で特定の文化知識や文化的背景、またそれに類する知識への造詣の深さが必要であるかどうかを判断してください。利用者にとっては平易な知識であっても、その文化に属していない人にとっては習得が難しい知識や経験である可能性に注意してください。

また、翻訳の訳文をローカライズする必要がある場合、文化性は非常に高いと判断されます。ローカライズの詳細については【こちらの記事】をご参考ください。

文化性には地理的なものだけでなく、年代的なものも含まれることに注意してください。例えば SNS や YouTube、TikTok などの翻訳の場合、いわゆる『ミーム』と言われるような表現もあるかもしれません。

3: 機械翻訳の利用者の知識

原文の内容を理解できるなら1、ほとんど理解できない場合は5です。

原文の専門性や文化性について、利用者（機械翻訳を使う人）が必要な知識をもっているかどうかを判断してください。

現状で知識としては知らない場合でも、調べ方や裏取りの仕方が分かる場合はスコアは低いと判断できます。調べ方や裏取りのやり方や、参照するべき適切な情報ソースが分からない場合は、特にスコアは高くなります。

4: 原文の全体の長さ

原文が短い場合は1、長い場合は5です。参考として、A4用紙1〜2枚分は5です。

原文の全体の長さがどれくらいかを判断してください。長ければ長いほど、確率的に間違いが含まれやすくなります。短い場合にも翻訳のヒントが少ないという弱点がありますが、ここでは確率的に発生する誤訳を評価対象としています。

ただし、YouTube などの動画や音声などの翻訳、あるいは字幕翻訳の場合、映像の補助がなければ文字数が少ない場合でも上手く翻訳できないケースがあります。そのような場合は5としてください。

5: 翻訳後の責任の所在

責任の所在が明らかで、かつ責任を取れる場合は1、不明であったり責任が取れなかったりする場合は5です。

機械翻訳の後に、その翻訳後のテキストの内容（影響や誤訳も含む）について誰が責任を負うか、明らかであるかどうか判断してください。一般に、機械翻訳や生成AIを用いたことによる訳文の責任の所在は利用者にあります。

6: 求められる情報の正確性

求められる翻訳精度が低ければ1、精度90%以上が求められる場合は5です。また、原文のエラーを修正する必要があるかどうかについても考慮してください。

翻訳後の情報の正確性について、どの程度求められるか判断してください。

ここでの正確性とは、原文の内容の取りこぼし（訳抜け）や余計な訳文の差し込み（ハルシネーション）がないこと、原文に対する誤訳のほか、データの正確性も指します。例えば、原文のデータが間違っている場合に修正が必要であれば、求められる正確性はかなり高いと判断されます。

修正が必要なデータの一例として、名称が変わったが旧名称で言及されているものを新名称に置き換える、ゲームの説明書のエラッタの翻訳時点での修正、人名の読み間違いの修正などがあります。

ただし、間違った情報があれば利用者自身で修正できるようであれば、『機械翻訳の時点での正確性』は低くても良いと判断できるため、利用者の判断によってスコアを減点することができます。

7: 求められるクリエイティビティ

求められるクリエイティビティが低ければ1、よりクリエイティビティが求められる場合や複数のバリエーションが必要な場合は5です。

翻訳内容にクリエイティブさがどれくらい求められるか判断してください。クリエイティブさが求められる内容の一例としては、広告の翻訳、キャッチコピーの翻訳、ゲームのキャラクターテキストの翻訳、YouTube などの動画の（文字数制限がある）字幕翻訳などです。

いわゆるトランスクリエーションが必要な場合は5となります。トランスクリエーションについての詳細は【こちらの記事】をご参考ください。

また、ローカリゼーションの際、（新奇性のある発想という意味ではなく）原文を参考に大きくリライトする必要があることから、クリエイティビティが求められる場合もあります。

それ以外には、原文に手を加える必要性が大きいテキストの一例として、SEO対策を伴う翻訳が含まれる場合があります。SEOと翻訳については、【こちらの記事】をご参考ください。また、DeepL などの機械翻訳、および ChatGPT や Claude などの生成AIを用いることによるSEOへの影響については、【こちらの記事】をご参考ください。

8: 翻訳前後のスタイルや文体、トンマナの調整

スタイルや文体、トンマナに制限がない場合は1、制限が強い場合は5です。

翻訳全体についてスタイルや文体、トンマナの調整が必要かどうか判断してください。

今回の翻訳全体におけるものだけでなく、以前の翻訳を参考に調整する必要があるかどうか、ブランドガイドラインなどに則る必要があるかどうかも考慮してください。以前の翻訳を参考にするべき翻訳とは、例えばシリーズものの作品（アニメやゲーム、マンガ、小説など）や、ブランディングに関わる翻訳などです。

9: 翻訳後のテキストの想定される影響力

想定される影響力が小さければ1、より大きな影響が期待される場合は5です。

今回の翻訳はどれくらいの人の目に触れるか、またそれによってどのような効果や影響力があると想定（期待）されるかを判断してください。個人利用に近いほど影響力は小さいと判断できます。

例えば簡単な情報収集としてニュースサイトの記事を翻訳してみる、海外のサービスへの簡単な問い合わせの英語訳に用いる、といった場合であれば影響力は低いでしょう。一方、いわゆるビジネスシーンと言われる業務で用いる、翻訳後のテキストが商用利用される、込み入った事情について英語で問い合わせをする、といった場合には、影響力は高くなります。

10: 翻訳外の専門性

翻訳外の専門性が低い場合は1、高い場合は5です。

仮にその業務が翻訳でなくゼロからテキストを作成する業務であった場合、その業務を専門とする専門家がいるかどうか、またその専門性を判断してください。

例えばマーケティング資料の翻訳の場合、マーケッターという専門家が存在する、法律文書の翻訳の場合、法律家という専門性が存在する、といったイメージです。

また、翻訳後の文章をより多くの人に読んでもらいたいというような場合、SEO対策が翻訳の中に含まれるべきであることがあるかもしれません。そのようなケースも、翻訳外の専門性があると考えられます。

上記、1〜10の質問への回答の数字を足してください。最低で10、最高で50になります。回答不能の質問や、自信がない質問については、すべて5で計算してください。

結果の数字と以下の対応をご確認ください。

10〜15: 機械翻訳の妥当性高

全体としては機械翻訳で良い可能性が高いが、万全を期すなら内容のチェックが望まれる。

内容のチェックは、翻訳後の文章の明らかなものに限ってチェックするだけでも充分である可能性が高いが、明らかな間違いの箇所の重要度が高い場合、そこのみ人的に翻訳する必要がある。

16〜30: 機械翻訳の妥当性: 中

下地としては機械翻訳を利用できる可能性が高いが、機械翻訳後に問題が発生する可能性が高いため、実際にその翻訳を用いる前に MTPE（Machine Translation Post Edit）が必要。

ただし、機械翻訳から MTPE を用いることによって、プロセス次第では機械翻訳による翻訳業務の高速化・効率化が可能である場合がある。

31〜40: 機械翻訳の妥当性: 低

部分的には機械翻訳を利用できる可能性があるが、推奨されない。また、利用箇所には MTPE が必要。

また、機械翻訳を用いることが翻訳業務の高速化・効率化に貢献しない可能性が高い。用いる場合には全体のうちの限られた範囲で使用するなど、使用範囲の区分が必要。

40〜50: 機械翻訳使用不可

機械翻訳は不向きの翻訳であり、プロの翻訳家に依頼するべき内容である可能性が高い。内容の専門性に応じて対応できる翻訳家に打診することが望まれる。

参考記事

機械翻訳（MT）を利用するMTPEは翻訳コストを削減できるのか？

CHATGPT、DEEPL、人間の翻訳の比較（英日）

CHATGPT、DEEPL、人間の翻訳の比較（日英）

英語業務や翻訳におけるCHATGPTの使い方

Akitsugu Domoto

Translator, wordsmith, speaker, author and part-time YouTuber.

https://word-tailor.com