【ACADEMY】ローカライズのための機械翻訳入門
機械学習はほぼすべての産業に浸透しており,ゲームのローカライズについても例外ではない。ソフトウェアプロバイダーは,機械翻訳製品がローカライゼーションの新時代を築いたと主張する一方で,ゲーマーは,ゲームパブリッシャがもっと細部にまで気を配ってくれればと思うことも少なくない。
機械翻訳のポストエディットに取り組んでいるローカライゼーション専門会社として,アルコノストはこのテーマを見逃すわけにはいかない。この記事では,機械翻訳(MT)の何が注目されているか(そして何が注目されていないか),そして品質を犠牲にすることなくMTを最大限に活用する方法について紹介したい。
NMTとはいったい何なのか?
機械学習がローカライズに導入されたとき,それは大きな資産と見なされ,ローカライズ会社はかなりの間,PEMTのアプローチを使用して作業していた。PEMTとは,post-edited machine translationの略で,機械がテキストを翻訳したあと,翻訳者がそれを見て編集することを意味する。PEMTの主な問題は,機械がテキストを以前または現在の翻訳や用語集と比較せずに翻訳することだ ― それはちょうどそれがそれを「見る」ように翻訳する。そのため,当然ながらミスが多く,手作業による校正が必要になる。
時代が進み,技術が進歩すると,NMT(neural machine translation)が登場するようになった。これは,より信頼性が高く,堅牢なソリューションであることが証明されている。NMTは,ニューラルネットワークとディープラーニングを使用して,単にテキストを翻訳するだけでなく,実際に専門用語とその詳細を学習している。このため,NMTはPEMTよりもはるかに精度が高く,十分な学習により,手動翻訳よりもはるかに速く高品質の結果を提供できる。
NMTソリューション:概要
当然のことながら,市場には数十の既製のNMTソリューションが存在する。これらは,純正NMTエンジンとカスタムNMTエンジンの2つに大別される。カスタム(またはニッチ)NMTツールについては後ほど説明するが,ここでは純正NMTに焦点を当てよう。
純正NMTエンジンは,一般的な翻訳データに基づいている。これらのデータセットは膨大で豊富だが(たとえばGoogleのデータベース),ドメイン指向ではない。つまり,純正NMTツールを使用すると,テキストの意味の一般的な理解は得られるが,特定のフレーズや単語の正確な翻訳は得られないということだ。
純正のNMTエンジンの例としては,Google Cloud Translation,Amazon Translate,DeepL Translator,CrossLang,Microsoft Translator,Intento,KantanMTなどがある。
これらのソリューションの最大の利点は,そのほとんどが(Google翻訳のように)公開されており,無料で使用できることだ。市販の純正NMTは,APIや統合オプションで有料のサブスクリプションを提供している。しかし,最大の欠点は,ゲームのローカライズの複雑さを考慮していないことだ。それについては,以下で詳しく説明する。
ゲームローカライゼーションの複雑さ
機械翻訳は多くの産業でうまくいくが,ゲームのローカライズは難しいことが分かった。その主な理由は,ゲーム(ゲームの種類を問わず)は常に没入感のある体験を目指しており,その体験の中核となるのが自然な音質の台詞やゲーム内のテキストであるためだ。では,それらを適切に翻訳することの何が難しいのだろうか。
●創造性
当たり前のことだが,ゲームに命を吹き込むには,とくに翻訳においてクリエイティビティが重要な役割を果たす。翻訳者がふとした瞬間にひらめいた,思いがけない言い回しや表現が,原文よりもはるかにプレイヤーの心に響くこともある。
機械はクリエイティブになれるのだろうか? まだ無理だ。つまり,機械翻訳には,ときにゲーム全体を輝かせるようなクリエイティブな要素が常に欠けている可能性があるのだ。
●特殊な言い回し,方言,スラング
ローカライズの最大の課題の1つは,できるだけ自然な感じの翻訳にすることだ。また,国や地域によって特有の言語や方言があるため,翻訳をうまく適応させるためには,その国の文化を十分に理解することが必要だ。
機械学習ソリューションは,既存のデータベースで学習させることができるが,現地の人しか使い方を知らないような非常に特殊なフレーズに出くわした場合はどうしたらよいのだろうか。このような場合,ネイティブスピーカーの言語専門家によるプロの翻訳と,コミュニティからのフィードバックが非常に役に立つ。ターゲット言語の複雑さを知っているネイティブスピーカーからのインプットは,最適な言葉遣いをアドバイスできる。そのためには,理論的な知識だけでなく,言語に対するフィーリングが必要なのだ。
●語調と全体の雰囲気
特定の言葉は,特定のトーンを持っている。これは我々が何も考えずに感覚でやっていることだ。だから,ゲームを翻訳する場合,人間の翻訳者はゲーム全体の雰囲気(または特定の会話)を感じ取り,元の言葉だけでなく,そのトーンや雰囲気をよりよく伝える同義語を使用できる。逆に,機械は「雰囲気を感じる」ことができないので,場合によっては自然な翻訳にならないこともある。
ゲームローカライゼーションにMTを使用するメリット
ゲームローカライゼーションにはさまざまな課題があるが,機械翻訳も十分な成果を上げている。この技術にはいくつかの重要な利点があり,特定のタスクに関しては,機械翻訳が最適な選択肢となる。
●スピード
機械翻訳の最大の利点であり,独自のセールスポイントであるスピード。翻訳者が何日も,あるいは何週間もかけて翻訳するのに比べ,機械はほんの数分で大量のテキストを翻訳できるのだ。多くの場合,まず機械翻訳を作成し,それを編集するほうがより速く,より効率的であることが証明されている。さらに,アップデートを迅速にリリースする必要があり,「十分な」翻訳品質で管理できる場合,MTのスピードは非常に便利だ。
●ゲーム外コンテンツの翻訳
ゲームのローカライズといえば,まず思い浮かぶのはゲーム内の会話だろう。しかし,ゲームローカライズはそれだけではない。ユーザーマニュアル,ハウツー,記事,ガイド,マーケティングテキストなどが含まれる。このようなローカライズは,ゲーム体験の没入感に影響を与えないため,クリエイティビティやイメージはあまり必要とされない。また,ユーザーがBlogを読んでいて間違いを発見しても,ゲーム体験が台なしになる可能性は低くなる。
●サービスのコスト
機械翻訳のもう1つの大きなメリットは,比較的安価であることだ。プロの翻訳者の料金と比較すると,機械翻訳はより手頃な価格になる傾向がある。そのため,より重要な業務に専門家を割り当てることができる一方で,コストを削減できるのだ。
●翻訳の一貫性
MTがプロジェクトにもたらすもう1つの利点は,翻訳の一貫性だ。複数の独立した翻訳者がテキストを翻訳する場合,特定の単語を異なる方法で翻訳することがあり,最終的に異なる訳文が出来上がる。しかし,機械翻訳では,繰り返しの多いフレーズは常に同じように翻訳され,テキストの一貫性を向上させることができる(※西欧の言語だとそうなのかもしれない)。
機械翻訳はゲームに十分適しているか?
ゲーマーによると,MTは100%正確ではない。たとえば,最近の Reddit の議論(参考URL)では,不満を持つゲーマーが数百のコメントを残しており,その大半は同じことを言っている:つまり,企業は高品質の翻訳に投資する代わりに,迅速な利益を追求しているというのだ。それでは,「十分に良い」結果を迅速に提供するためのツールは何だろうか? お分かりだろうが,それは,機械翻訳だ。
では,Google NMTが十分でない場合,どのような選択肢があるのだろうか。ここでは,最も効果的と思われる方法を考えてみる。
●ローカライゼーションに特化したNMT
ニューラル機械翻訳には欠点もあるが,多くの利点もある。素早く,適度に正確で,大量のドキュメント(ユーザーマニュアルなど)を素早く翻訳する必要がある場合には,実際にかなり役に立つ。そこで,我々が完璧なソリューションと考えるのは,ニッチ指向のローカライゼーション専用NMT(またはカスタムNMT)だ。
たとえば,Alconostは現在,ニューラル機械学習と異なる言語の膨大な翻訳データベースを使用する製品に取り組んでいる。これによって,より高い精度を達成し,一般的な翻訳だけでなく,ゲーム翻訳にも機械を適応させることができる(この2つの間には大きな違いがある)。また,クラウドプラットフォーム(CrowdinやGitLoсalizeなど)やオープンソースのデータを使用している。つまり,あるプロジェクトで使用した用語集や翻訳メモリは,別のプロジェクトでも使用できるのだ。また,翻訳者がテキストをポストエディットし,翻訳が正しく行われたことを確認することも可能だ。
カスタムドメイン適応型NMTソリューションは,特定のドメインを念頭に置いて設計されているため,ローカライズのマイルストーンとなる可能性がある。その最大の利点は,高い翻訳精度,スピード,手頃な価格(プロの翻訳者を雇うより安い),新しいニッチやドメインを開拓するオプションである。
ユーザーレビューのようなコンテンツは,あまりに特殊で数が多くないため,翻訳されないことがある。そのようなコンテンツの翻訳に純正のNMTソリューションを使用するのはあまり意味がなく,ポストエディットが必要になるからだ。
しかし,カスタムNMTツールは,ユーザーレビューに対応し,声のトーンを「理解」するように設計できるため,このような特殊なコンテンツも機械で翻訳することが可能である。このソリューションはAirbnbで導入されており,レビューやその他のユーザー作成コンテンツは「翻訳」ボタンを押すだけで瞬時に翻訳されるようになっている。
さらに,機械翻訳は感情や気分を認識するように訓練することができ,機械学習による分類器と組み合わせることで,フィードバックにラベルを付けて優先順位をつけることができる。これは,ユーザーのオンライン行動に関するデータ収集にも利用でき,どの企業にとっても非常に価値の高い資産となるだろう。
機械翻訳が従来のローカライゼーションと異なる点
最後に,機械翻訳された文章をローカライズする場合,通常のローカライズとどのように違うのか,その複雑な仕組みについて説明したい。それぞれ異なるプロジェクトで得られた我々の経験も踏まえながら,2つのアプローチを比較してみよう。
●プロセス
ゼロからローカライズする場合は,最初から用語集やコンテクストが用意されているので,品質を完全にコントロールできると言ってよいだろう。ここでは,特定のドメインを意識してテキストを翻訳しており,翻訳後の原稿を編集することはほとんどない。
しかし,機械翻訳の場合は少し違ってくる。原文はさまざまなエンジンで翻訳されるが,その品質や精度はどれも異なるのだ。そこで,これらのテキストを扱う際には,利用可能なすべての資料(スタイルガイド,用語集など)をクライアントに依頼し,翻訳がドメインやブランドのスタイルに合っていることを確認しなければならない。つまり,機械翻訳のポストエディットには,プロジェクトの品質と正確さを評価するステップが追加されるのだ。
●品質
従来のローカライズ手法を選択した場合,99%の確率で,特定の言語とドメインについて最も経験のある担当者がそのプロジェクトを担当することになるだろう。
しかし,機械翻訳の場合,機械がどの程度訓練されているか,異なる言語に対してどの程度のデータを持っているかは,実際には確認できない。あるエンジンは1万ページのスペイン語-英語翻訳を学習したかもしれないが,別のエンジンは100万ページを学習したのかもしれない。明らかに,後者のほうがより正確だ。
要するに,ニッチなトピックを扱うプロのローカライズ会社が「学習」した機械翻訳エンジンを使用する場合は,カスタマイズしたMTエンジンの「熟練度」,ひいては翻訳の品質を確保できる可能性が極めて高いということだ。豊富な翻訳データベースとプロのエディターがそばにいれば,プロジェクトは安心して任せられるだろう。
Kris Trusava氏は,ゲームやその他のソフトウェアのローカライズサービスを80か国語以上に提供するAlconostのローカライズグロースマネージャーだ。
GamesIndustry.biz ACADEMY関連翻訳記事一覧
※本記事はGamesIndustry.bizとのライセンス契約のもとで翻訳されています(元記事はこちら)