高精度化した英日AI自動翻訳のエコシステムを創出

更新日:2020.12.23

オープンソースのコミュニティにNICT「みんなの自動翻訳」を提供

国立研究開発法人情報通信研究機構(理事長:徳田 英幸、以下「NICT」)は、Linuxを含むオープンソースソフトウェアを推進するLinux Foundation Japan(日本代表者:福安 徳晃、以下「LF」 )に、「みんなの自動翻訳」のAI自動翻訳技術を提供します。LFは、AI自動翻訳技術をLFのサーバに実装し、2021年1〜3月期のサービス開始を目指します。LFのオープンソースプロジェクトで同自動翻訳エンジンを使用し、翻訳作業で生成されるオープンソース技術関連の対訳・語彙データをNICTの翻訳バンク注1にフィードバックします。両者が協力することで、オープンソースソフトウェア向けの高精度AI自動翻訳システム注2を育てていくエコシステムを創出し、日本のソフトウェア開発を支援してまいります。

背景

ITに関わるソフトウェアの進化は急速で、その要であるオープンソースソフトウェア支援団体の代表がLinuxの作者Linus Torvaldsを擁するLFです。LFは、オープンソースソフトウェアに関する英語文書を大量に出版しており、クラウド等の最新のソフトウェア情報をいち早く日本語化することは、日本の競争力を高める鍵となっています。しかし、英語と日本語は文法も語彙も異なるため、言葉の壁から、日本のエンジニアやマネージメント層が最新技術をキャッチアップするのに苦労するような場合も生じています。

今回の協力について

今回、NICTは、言葉の壁を越え、いち早く最新情報を入手できるようにするため、LFにNICTの自動翻訳エンジン「みんなの自動翻訳」を提供します。NICTの自動翻訳エンジンをLFのサーバで稼働し、オープンソースソフトウェアコミュニティの翻訳協力者はLFのシステムにログインして自動翻訳エンジンにアクセスします。翻訳作業を効率化するとともに生成される対訳データを翻訳バンクにフィードバックします。これを追加的に学習して高精度化したエンジンで、再度LFのサーバを更新します。このようにして、オープンソースソフトウェア向けの高精度AI自動翻訳システムを育てるエコシステムを創出します。

LF代表は「海外の企業とのビジネスが一般的になった現在でも、言語の壁は引き続き日本の産業の大きな課題であると感じています。特に情報の多くが英語で生成されるオープンソース技術は、ドキュメントを含めた様々な情報が日本語化されない限り、最先端の情報が国内で一般化されないという重要な課題に直面しています。今回のNICTとの取り組みを通じて、最先端の技術情報がより早くかつ大量に日本語化され、日本のオープンソース開発者が迅速に必要な技術情報にアクセスできる環境づくりに寄与することを願っています。」と述べています。

今後

NICTのAI自動翻訳技術をLFのサーバに実装後、LFは2021年1〜3月期のサービス開始を予定しています。両者は協力して、エコシステムを強化し、オープンソースソフトウェアに関する日本の言葉の壁を解消して、日本のソフトウェア開発を支援してまいります。サービス開始時はLFのオープンソースプロジェクトで使用し、プロジェクト横断的に業界に特化した対訳・語彙データを生成することで、日本のオープンソースコミュニティ全体が安心して利用できる翻訳精度の高い自動翻訳システムを構築することを目指します。