生成AIの活用 注意喚起
生成AIをナレーション・字幕翻訳に活用する問題点
生成AIの英訳は、早いしコストもかからず使い勝手がいいようですが、まだまだ多くの問題があります。以下は日本語から英語への翻訳において、日本語と英語の根本的な違いにより起きてしまう誤訳を説明いたします。
- 1) 日本語には大文字・小文字がありませんが、英語の大文字・小文字の使い分けには厳格なルールが存在します。例えば、タイトルでは単語の頭文字を大文字にしたり、固有名詞は頭文字を大文字にする必要があります。そして、固有名詞(頭文字が大文字)なのか、一般名詞なのかによって、冠詞の使い方も変わってきますが、生成AIは大文字・小文字を適切に判断し、正しく使い分けることができません。それに伴い、冠詞の使い方を間違えることもよくあります。
- 2) 日本語の名詞には、単数形・複数形が存在しませんが、英語の名詞のほとんどには単数形・複数形が存在します。しかし生成AIは、文脈から適切に単数形・複数形を判断することが出来ない場合が多いです。これは特に、参考資料の画像や映像を見ながら翻訳を行う場合、生成AIには不可能な作業となります。しかも、英語では名詞の単数形・複数形を変えただけで、文章全体の言い回しが変わります。
- 簡単な例で説明しますと、「これはリンゴです」には下記 二通りの英訳があります。
- This is an apple.(単数) These are apples.(複数)
- ご覧の通り、この短い文章でも、全ての単語が変わってしまいます。
- * This → These * is → are * an → 複数形の場合は省かれます。 * apple → apples
- 3)英語では全ての文章が主語を必要とします。しかし日本語は、主語を必要としない言語です。従って、簡単な和文でも主語が抜けていると、AI が勝手に間違った主語を入れて誤訳してしまうことがよくあります。
- (例)店内放送で「お客様に申し上げます」→ "I would like to inform our customers"と訳してしまいします。この英文の主語は “I (私)”で、確かに喋っているのはアナウンサー自身ですが、アナウンサーが店内放送で「私から、お客様に申し上げます」と言うのは不適切です。ここでは、「お店側からのアナウンス」として、英語で使う適切な主語は “We” となります。
- 4)生成AIは、原文にあるタイプミスや漢字の変換ミスなどを見抜き、適切に訳すことが出来ません。
- 5)日本の人名、地名、本のタイトルなどのローマ字変換には多くのミスが見られたり、ローマ字の形式を統一が苦手です。
- 6)英語の自然な語順は、日本語の語順と真逆に近い場合が多いですが、生成AIは日本語の語順をそのまま直訳してしまう傾向があり、不自然かつ読みづらい訳文になる傾向が強いです。
- 7)原文に和製英語が使われていると、そのまま使ってしまうことが、よくあります。また、文法的には間違っていなくても、ネイティブには通じないことがあります。また、あまり使わない、「日本人好み」の単語や言い回しを使うこともあります。
上記6番と7番の理由は、生成A Iのトレーニングに使われたデータに、日本人の手が加えられた国内に存在する英語の資料が多く使われた可能性があります。真相は開発者にしか分かりませんが、事実として、このような不自然な訳が、かなり多く見受けられます。
- 8)映像翻訳には対応できません。映像翻訳(ナレーションや字幕翻訳)は、訳文の尺合わせが不可欠です。また、映像の展開やテロップ表示のタイミングに合わせて訳文の語順も調整する必要があります。しかし生成AI には、そこまで細かい作業はできません。
- 生成AIは、かなりの頻度で自信満々に、嘘をつきます。生成AIの答えを鵜呑みにせず、過剰に評価・信頼しないことが必要です。和訳の日本語では気がついても、外国語訳に際して、日本人がネイティブチェックを入れずに、ビジネス用途に使うは極めて危険です。