海外の方とコミュニケーションを取るとき、自動翻訳サービスを使ったことがある方は多いでしょう。そのときに、もう少し翻訳精度が高ければいいのに……と感じたことはありませんか?そんな中、翻訳精度に定評がある「POCKETALK(ポケトーク)」は、ポケットサイズの双方向通訳機として多くの人に利用されています。

このポケトークに搭載されているAI翻訳システムをつくっているのが「翻訳バンク」と呼ばれる公的機関の活動です。AI翻訳では、データ量が集まれば集まるほど翻訳精度が上がるため、特定企業の利益に資するのではなく、データを集められる公的機関の活動である翻訳バンクに基づくシステムは非常に高精度。実は、多くの団体や企業に活用されているのです。

今回は、そんな翻訳バンクの取り組みを探るべく、総務省と共に翻訳バンクを運営する国立研究開発法人情報通信研究機構(NICT)の隅田英一郎さんにお話を伺いました。

どんな場面で使われる? 自動翻訳システムの活用事例を紹介

ポケトークにも搭載!国産自動翻訳エンジン「翻訳バンク」にできること
(画像=情報通信研究機構(NICT) 翻訳バンク)

まずは、どんな場面で自動翻訳システムが使われているのかを伺いました。

さまざまな企業のさまざまな場面で翻訳バンクのデータや技術は活用されているようです。例えば、証券会社や銀行などの金融機関が、業界や個別の会社、経済動向などの分析をしてまとめる「アナリストレポート」。今は日本市場にも海外投資家が増えてきていますから、アナリストレポートを海外投資家に読んでもらう必要があります。

金融業界には、業界特有の表現、投資家がよく使う言葉の使い方があります。その特徴をつかんだ翻訳になるように、データを入れて学習させていくそうです。このシステムは現在、SMBC日興証券で日常的に使われており、翻訳の効率化を実現しています。

隅田さんはもう1つ、事例を紹介してくださいました。

製薬会社のMSD株式会社は、自社で作成している医学事典「MSDマニュアル」のデータをすべて提供し、NICT(翻訳バンクを運営する組織)が提供するスマホ用の多言語音声翻訳アプリ「VoiceTra(ボイストラ)」に反映しました。

これによって、いつでも誰でも「VoiceTra」を使えば、薬や医療関係の専門用語が適切に翻訳することができるようになったのです。このように、業界特有の専門用語も、いろいろな企業や団体からデータを集めることで、適切に自動翻訳できるようになることが翻訳バンクの大きな特徴です。

「競争」ではなく「協調」のスタンスでデータを「寄付」してもらう

NICTは、高精度な自動翻訳システムを日本中に広げることをミッションとし、長年自動翻訳の研究を続けてきました。先ほど紹介したスマホアプリ「VoiceTra」に加え、PCなどのWebブラウザで使用できるWeb翻訳サービス「みんなの自動翻訳@TexTra®(テキストラ)」も提供しています。

翻訳バンクでは、中央官庁、地方自治体、企業、各種団体など日本の多くの組織からデータを集め、NICTの自動翻訳の高精度化に活用しています。翻訳バンクの取り組みは、GAFAをはじめとするグローバル企業の翻訳サービスと異なる特徴があります。それが、「競争」ではなく「協調」を基調とする取り組みであること。

「自動翻訳精度を上げるためには、たくさんのデータが必要です。世界中のデータを『翻訳バンク』という1つの公的機関の活動に集約することで、個々の民間組織ではできない精度を実現することができます」(隅田さん)

公的機関への集約だからこそ、企業間の利害関係や競争意識が起こりにくいため、「大量のデータを収集しやすい」のです。隅田さんは企業からのデータ提供をデータの「寄付」と言っています。

「競争」ではなく、「協調」。その考え方自体は、万人に受け入れられやすいものでしょう。ただ、民間企業は営利団体ですから、自分たちで手間と時間をかけて集めたデータを、無料で「寄付」することに抵抗を感じる会社もあるかもしれません。

そんな考え方に対し隅田さんは、「データの寄付が単なる慈善活動に終わらず、しっかりと企業活動にインパクトのある取り組みである」ことを紹介してくださいました。

「例えば、製薬会社の文書作成効率化の事例。100万文を超える対訳データを翻訳バンクに提供し、高精度な自動翻訳システムを開発しました。すると、以前は4週間かかっていた治験実施計画書の作成期間が2週間に削減されました。高精度翻訳によって業務が効率化されれば、その分の人件費等のコストを削減できるだけでなく、開発や市場に出せるまでのスピードも上がります。企業活動に大きなインパクトを与えることは間違いないでしょう」(隅田さん)

このように、多くの業界でデータを集めている翻訳バンクですが、今後データ収集を期待される分野は「契約書」だといいます。

「契約書は機密文書ですから、本質的にデータ提供しにくい。日本企業の契約書に比べて、欧米企業の契約書はかなり分厚いので、原文で読むのはかなり大変です。それを日本語に翻訳しようとして翻訳会社に依頼すると時間もコストもかかってしまいます。この分野で高精度な自動翻訳システムができれば、時間もお金も節約できるはずです」(隅田さん)

データ量が少ないと精度は上がらないので、契約書のデータ収集は現状の課題の1つとなっているようです。

文化の普及にも自動翻訳が役立つ!

翻訳バンクは今後どう展開していくのでしょうか。隅田さんは2つの方向性を教えてくれました。

1つは、「文化」の普及。ここまで紹介した事例は主にビジネス分野での活用でしたが、日本文化を海外に紹介する、あるいは海外文化を日本に紹介する中で、自動翻訳システムが役立つ場面が増えていくでしょう。

一例として、2021年11月に設立された「日越茶道・文化交流協会」があります。茶道の文化を世界に広げていく団体として、ベトナムとパートナーシップを結び、自動翻訳システムを活用していこうとしています。会長の茶道裏千家15代家元・千玄室さんは、以前から海外に茶道という文化を伝える活動をされており、多言語の通訳の必要性が高いと考えていたため、翻訳バンクの技術を使う取り組みを開始しました。

日本が今後、海外へのプレゼンスを発揮していくには、ソフトパワーの発信が必要です。その意味で、文化への展開は有用であると考えられます。

2つ目は「海外」への方向性です。翻訳バンクの「データ収集の仕組み」を海外に展開しようとするものです。「競争」ではなく「協調」。この考え方をASEANやインドをはじめとする近隣諸国にも浸透させようとしているのです。相互翻訳がよりスムーズにできるようになれば、言葉の壁の解消がより近づくでしょう。

「公的機関が民間からの寄付と言う形でデータをお預かりするので、コスト面でもお得。データのセキュリティ面でも、会社の大切なデータを、一部の強い企業に独占されてしまうことがないので安心です」(隅田さん)

NICTでは、毎年3月に「自動翻訳シンポジウム」を実施しています(参加費無料)。また、隅田さんが会長を務める「アジア太平洋機械翻訳協会」では12月8・9日に年次大会を開催しました。今後もこうしたイベントを通して、最新の機械翻訳に関する情報を発信していくようです。

文・fuelle編集部

【こちらの記事も読まれています】
つみたてNISA(積立NISA)は損する? 14の落とし穴・損しないための対策を徹底解説
SBI証券と楽天証券どちらで開設する?つみたてNISAやiDeCoも比較!
つみたてNISA 毎月いくら積み立てるのがいい?自分に合った金額の決め方
主婦がつみたてNISAを始めるメリット・デメリット!iDeCoとの違いも解説
つみたてNISAの商品はどう選ぶ?FP厳選おすすめ商品3つ