[TS12] 自社に特化したAI翻訳活用でタイムリーな情報提供を実現 ~特定分野に集中させたAI翻訳モデルの継続的な追加学習で、ポストエディットレスでの情報提供~

発表の趣旨

ISE-SYSTRAN

 AI全盛の現在、世界にはいろんなAI翻訳サービスが溢れています。汎用的な翻訳をするものや、専門的な翻訳をすると謳うものまで様々。しかし、お客様自身のデータを集中的に学んだ翻訳エンジン(翻訳モデル)の品質には、既存のどの翻訳エンジンも敵いません。お客様のデータに特化した翻訳結果を導き出すようにAIが学びます。
AI翻訳の結果が間違っていれば、学習した翻訳データが起因します。用語やスタイル等、要件に合わない翻訳を直す方法は、学習データを修正してAIの再学習をするのがベストです。特化した学習を可能にするのがSYSTRAN Model Studio Liteです。学習データをコントロールし、SYSTRAN Model StudioでAI再学習サイクルを何回も繰り返すことで、翻訳結果をコントロールすることができます。

本セッションでは、SYSTRAN Model Studio Liteを使用した翻訳結果改善の例を具体的にご紹介するとともに、作成したAI翻訳モデルの活用について海外事例を交えてご紹介します。

■目的別にAI翻訳モデルを構築することは効果的ですか?

自社の製品シリーズなどで使用している固有表現を正しく翻訳できるようにするために、製品分野毎に専用のAI翻訳モデルを構築することは効果があります。同じ用語でも対象分野によって適切な意味が異なることがありますので、それらの用語が使用されている対訳データを教師データとしたAI翻訳モデルは、その分野に適した翻訳結果をもたらします。専門性が高い領域や、文章の対象が特殊な場合などにおいても、その分野に特化したAI翻訳モデルの構築によって、意図した翻訳結果が得られるようになります。

SYSTRAN Marketplaceは、目的に特化させたAI翻訳モデルを利活用できるプラットフォームです。AI教師データからAI翻訳モデルを1から構築しなくても、すでに公開されているAI翻訳モデルから目的に合うモデルを選択して利活用できます。そのモデルを更に特化させたい場合には、追加学習をして、より自社の意図に沿う翻訳結果を出力するAI翻訳モデルを構築できます。

ISEでは、中日/日中医療分野に特化させたAI翻訳モデルを、SYSTRAN Marketplace上で公開しています。中国語で書かれた医療関係の文書を、適切な用語で日本語に翻訳できるようチューニングした目的特化型の専門エンジンで、IVD(In-Vitro Diagnostics)分野の翻訳に特化しています。医療関係ドキュメントを翻訳される方にご活用いただけましたら幸いです。詳しくは、以下のサイトを参照ください。

翻訳対象物の分野毎に、専⾨⽤語やTMが異なる場合には、訳し分けはできますか?

SYSTRAN Pure Neural Server[以下、SYSTRAN PNSと表記]には、翻訳時に使⽤する辞書やTranslation Memoryを指定できるプロファイル機能があり、翻訳対象に適切なプロファイルを選択して翻訳できます。

プロファイルには、Translation Memoryや辞書を指定できます。SYSTRAN PNSのプロファイルに指定できる主な翻訳リソース

  • Translation Memory:過去翻訳を適⽤する場合に設定。
  • ユーザー辞書:ソース言語に対するターゲット言語の対訳辞書。
  • 正規化辞書:⽇英翻訳であれば、翻訳前処理としての⽇⽇辞書、翻訳後処理としての、英英辞書
    英⽇翻訳であれば、翻訳前処理としての英英辞書、翻訳後処理としての、⽇⽇辞書 など翻訳時に、ソース言語からターゲット言語に翻訳する際に対訳となる辞書がユーザー辞書です。一方、翻訳前や翻訳後に、使用されている用語を、意図する同一言語の用語に修正するのが正規化辞書となります。

発表者

株式会社 情報システムエンジニアリング 若林 夏樹
シストランジャパン(合) 江上 聡