この記事は、「LLM・LLM活用 Advent Calendar 2025」のシリーズ3の9日目の記事です。記事執筆時点ですでに、このアドベントカレンダーには多くの知見が集まっています。ぜひ他の記事もご覧ください。
この記事は、言語モデルに翻訳をさせた際の誤訳について、実体験をまじえて書いた技術系ポエムです。外国語を読み書きしたい場面でのAIの活用法についてまとめました。
AI翻訳は英語圏のOSSにIssue報告するとき便利!
私は、ChatGPTをはじめとする言語モデルを駆使していくつかのOSSにIssue報告をしたことがあります。プログラミングなら少しはできますが、英語含め外国語はちっとも書けないので……。
翻訳タスクに関しては現状の言語モデルもなかなかいい感じに動いてくれるので、ありがたい限りです。
とはいえ、きちんと見直さなければ意訳によってニュアンスが変わってしまっていることもあるので注意は必要です。例えば、1つしかないバグを勝手に複数形で表現されたことがありました。日本語の原文では単数・複数は非明示的ですから、仕方がないところはあるかもしれませんが、意味が大きく変わってしまう危険性があったため、ヒヤッとしました。
AI翻訳は万能ではなく、誤訳もする……。
業務上やり取りされるようなお硬い文章であれば意訳が暴走しすぎることはあまりないかと思います。しかし逆に言うと、文学的で示唆に富んだ文章は致命的な誤訳がされてしまうこともあるかもしれません。
以前、中国の寝そべり族について調べていた際に中国語の文章を翻訳したいことがあり、PLaMo翻訳を使いました。中国語は漢字が使われているためある程度とっつきやすくはありますが、分かち書きされていないこともあって、文章単位で読むとなると難易度は高いです。
我可以向第欧根尼之水在自己的木桶里晒太阳,也可以向赫拉克利特在山洞里思考‘逻各斯’,既然这片土地从没真实存在高举人主体性的思潮,那我可以自己制造给自己。
出典:“内卷”与“躺平”之间挣扎的中国年轻人 - BBC News 中文
この文章のもっともらしい日本語訳は次の通り。
私はディオゲネスのように自分の木桶の中で日向ぼっこをしてもいいし、ヘラクレイトスのように洞窟で「ロゴス」について思索してもいい。この地にはかつて一度も、人間の主体性を高く掲げる思想の潮流が実際に存在したことなどなかったのだから、ならば私は私のために自らそれを作り出せばよいのだ。
一方、PLaMo翻訳による日本語訳は次の通り。

私はディオゲネスのように自分の樽の中で太陽を浴びることも、ヘラクレイトスのように洞窟で「ロゴス」について思索することもできる。この土地が真に人間の主体性を高揚させる思想を真に育んだことがないのであれば、私は自分自身でそのような思想を創り出すことができるのだ。
「かつて一度も存在したことなどなかったのだから、」という部分が、「(もし)ないのであれば、」という仮定を置いた形に改変されてしまっています。ここは文中の核となる思想です。致命的な誤訳であると言えるでしょう……。
この部分の文章構造は、直訳すると以下のようになります。
- 「既然A,那B」=「Aなのだから、B」
- A:「这片土地 从没 真实存在 高举 人 主体性 的 思潮」=「この土地にはかつて一度も人間の主体性を高く挙げた思想の潮流が実際には存在しなかった」
- B:「我 可以 自己 制造 给 自己」=「自分のために作り出すことができる」
相当基本的な文章構造だと思うのですが、なぜPLaMo翻訳は誤訳してしまったのでしょうね。穏当な表現を選ぶよう学習してしまっていたのか、なんなのか……。
ローカルのLM Studioで動かしたGemma 3 12Bもダメダメでした。しかし、記事執筆時点で最新のChatGPT(GPT-5.1)やGemini(2.5 Flash)で少し試してみたところ誤訳されなかったため、おそらくは性能の高低で誤訳したりしなかったりする、ということなのでしょう。

私はディオゲネスのように自分の木桶の中で日向ぼっこをしてもいいし、ヘラクレイトスのように洞窟で「ロゴス」について思索してもいい。この土地には、もともと主体性を高く掲げる思想など実際には存在してこなかったのだから、ならば私は自分のために、それを自分で作り出せばいいのだ。
では、AI翻訳はどう活用すればいいのか?
現段階の言語モデルはまだ、性能によっては、機械翻訳をいつでも完璧に行えるというわけではないようです。とはいえ、従来の機械翻訳ツールや他の言語モデルが出力した文章などと照らし合わせた推理などもすれば、現時点の品質であっても、言語モデルは十分に役立てられる強力なツールだと思います。
個人的におすすめしたい活用法は、「文法解説を求めることを通して結果的に翻訳を手に入れる」というものです。このように言われた言語モデルは、単純に翻訳を行うよりも長いプロンプトで段階を踏んで原文について考えを深めます。言ってしまえばこれはChain-of-Thoughtのようなもの。直接翻訳を依頼するより高品質な訳文が得られることが多いように感じます。

LM Studioで動かしたGemma 3 12bに文法解説を求めた様子
(結局間違った翻訳をしてしまっているものの、十分に文法の解説はしており、これを手掛かりに人間が推理することはできると思います。)
この中国語の文章は、非常に詩的で哲学的な内容を含んでおり、文法も少し複雑です。一つずつ分解して解説します。
全体の構造:
この文章は、「~也可以~」という並列構造を基盤としています。前半が具体的な行動の例示、後半がそれに対する結論と自己創造の宣言となっています。
各部分の詳細な解説:
我可以向第欧根尼之水在自己的木桶里晒太阳 (Wǒ kěyǐ xiàng dì ōu gēn nī zhī shuǐ zài zìjǐ de mùtǒng lǐ shài tàiyáng)
- 我可以 (Wǒ kěyǐ): 私は~できる。 (許可、能力、可能性を表す)
- 向 (xiàng): ~に向かって、~に倣って。ここでは比喩的な意味合いで使われています。
- 第欧根尼之水 (dì ōu gēn nī zhī shuǐ): ディオゲネスの水。ディオゲネスという哲学者のことを指していると思われます。「之」は所有格を表す助詞です。
- 在自己的木桶里 (zài zìjǐ de mùtǒng lǐ): 自分の樽の中で。場所を示す句です。
- 晒太阳 (shài tàiyáng): 日光浴をする。
全体の意味: 私はディオゲネスのように、自分の樽の中で日光浴をすることもできる。 (ディオゲネスの簡素な生き方を比喩的に表現)
也可以向赫拉克利特在山洞里思考‘逻各斯’ (Yě kěyǐ xiàng hè lā kè lì tè zài shāndòng lǐ sīkǎo ’luò gé sī’)
- 也可以 (Yě kěyǐ): ~もできる。 (前の文と並列)
- 向 (xiàng): ~に倣って、~のように。
- 赫拉克利特 (hè lā kè lì tè): ヘラクレイトス。古代ギリシャの哲学者。
- 在山洞里 (zài shāndòng lǐ): 山洞の中で。場所を示す句です。
- 思考 (sīkǎo): 考える。
- ‘逻各斯’ (’luò gé sī’): ロゴス。ヘラクレイトスの哲学における重要な概念。
全体の意味: 私はヘラクレイトスのように、山洞の中でロゴスについて考えることもできる。 (ヘラクレイトスの思想に触発される様子)
既然这片土地从没真实存在高举人主体性的思潮 (Jíqián zhè piàn tǔdì cóng méi zhēnshí cúnzài gāojǔ rén zhǔtǐ xìng de sīcháo)
- 既然 (Jíquán): ~なので、~というわけで。理由や前提を示す接続詞です。
- 这片土地 (zhè piàn tǔdì): この土地、この地域。
- 从没真实存在 (cóng méi zhēnshí cúnzài): 実際に存在したことがない。否定を表す表現です。
- 高举人主体性的思潮 (gāojǔ rén zhǔtǐ xìng de sīcháo): 人間主体の思想潮流を高く掲げる。 「高举」は高く掲げる、「人主体性」は人間中心主義、「思潮」は思想潮流という意味です。
全体の意味: この土地で、人間中心主義の思想潮流が実際に存在したことがないからには…
那我可以自己制造给自己 (Nà wǒ kěyǐ zìjǐ zhìzào gěi zìjǐ)
- 那 (Nà): ~だから。前の文に対する結論を示す接続詞です。
- 我可以 (Wǒ kěyǐ): 私は~できる。
- 自己制造 (zìjǐ zhìzào): 自分自身で作り出す。
- 给自己 (gěi zìjǐ): 自分自身のために。
全体の意味: だから、私は自分自身のためにそれを創り出すことができる。
文法的な特徴:
- 比喩表現の多用: ディオゲネスやヘラクレイトスを引用することで、抽象的な概念を具体的に表現しています。
- 並列構造 (~也可以~): 複数の選択肢を示し、自由な生き方を肯定しています。
- 「向」の比喩的用法: 単なる方向を示すだけでなく、「倣って」「のように」という意味合いで使われています。
- 複雑な修飾句: 長い修飾句が連続することで、文章に深みと奥行きを与えています。
- 哲学的な語彙: 「逻各斯 (ロゴス)」などの専門用語を使用しています。
全体の意味の解釈:
この文章は、既存の価値観や思想に縛られず、自分自身の生き方を作り出すことの重要性を訴えていると考えられます。ディオゲネスのように簡素な生活を送ることも、ヘラクレイトスのように深く考えることもできるし、もしそのような思想潮流が存在しないのであれば、自分でそれを創り出すことができるという強いメッセージが込められています。
補足:
- この文章は非常に詩的で抽象的なため、解釈には幅があります。
- 翻訳の際に、ニュアンスを完全に伝えるのが難しい場合があります。
- 文法的な正確さだけでなく、文脈や背景も考慮して理解する必要があります。
この解説が、文章の理解に役立つことを願っています。
もちろん、人間がその文法解説を読んで学べることもあります。こういった手掛かりから最終的には人間が意訳を行うというのも一つの手でしょう。特に中国語は、英語や他のヨーロッパの言語と違い、分かち書きがされていません。分かち書きさえされていれば基本的な文章構造が見えてきて、辞書を引くなどの古典的ながらも有用な手段を取ることもできます。こういった場合に、言語モデルに基本的な文法解説を依頼するというのは、理に適っているでしょう。
……将来的にはこういった手間もなくなってくれるとありがたいのですが。
しかしそもそも言語モデルを使った翻訳においては、原文の「文脈」の質も重要になってくるところではあります。未検証ですが、もしかしたら、「中国語の文章の断片を日本語に訳させる」より、「その断片を含む中国語の資料全体を渡したうえで、特定の箇所を日本語に訳させる」ほうが高品質な出力が得られたかもしれません。
もとの話の例で言うと、「日本語のIssue報告文をそっくりそのまま英語に訳させる」というタスクを言語モデルにさせるよりも、「日本語で書かれた資料や報告書をうまくIssueとして英語でまとめる」というタスクをさせたほうが高品質な出力が得られたかもしれないということです。
言語モデルは驚くほど汎用的な知能を獲得しています。従来の機械翻訳ツールとはまた違った使い方を考えてみる必要があるかもしれません。