進化と限界
GPT-3 (Generative Pre-trained Transformer 3)は、「1750億のパラメータ(変数)を持つ自己回帰型言語モデル」で、機械学習のために、Webサイトから数年にわたり収集した1兆語におよぶデータセットを使用し、英単語や短い文章をインプットすると、関連する「それらしい」テキストを自動生成するツールです。(参照※1)登場以来、もしかしたら、GoogleのSEOでも使えるのではないか?と話題になっていましたが、GoogleのGary Illyes 氏がツイッターで、「機械翻訳されたコンテンツはインデックスしない」と投稿しました。(参照※2)ディープラーニングの機械翻訳は、確かに日進月歩ですが、まだまだ未完成な技術です。例えば、「Honesty doesn’t pay.(正直者は馬鹿を見る)」ということわざですが、精度が高いと評判のDeepLで翻訳してみると、成句であればきちんと翻訳してくれますが、否定形を短縮しない形にするなど、少しでも変わると、「正直者はお金を払わない」と逆の意味に翻訳してしまいます。(参照※3、図1)さらに、いかにも「それらしい」日本語訳を出力するので、誤訳や訳漏れにとても気づきにくく、翻訳者界隈では、「絶対にこんなの校正したくない」と戦々恐々としています。
※1 新AIツール – ITmedia ビジネスオンライン
https://www.itmedia.co.jp/business/articles/2007/29/news025.html
※2 機械翻訳はNG – SEO Round Table
https://www.seroundtable.com/google-machine-translated-content-29957.html
※3 DeepLの実力を見よ |@TNK_KNCH
https://twitter.com/TNK_KNCH/status/1302540714731945984?s=20