強誘電体トランジスターを用いた人工知能計算の新方式を開発
~高い精度での音声認識を実現~
ポイント
- 強誘電体トランジスター(FeFET)を物理リザバーとするリザバー・コンピューティングと呼ばれる機械学習方式において、音声認識への応用を念頭に、高速計算が可能な並列データ処理により、時系列データを効果的に処理する新しい方式を提案。
- 0から9までの数字の音声認識に対して、酸化ハフニウム系強誘電体からなるFeFETを用いた物理リザバー・コンピューティングにおいて、95.9パーセントの認識精度を実験的に達成。
- 効率的なオンライン学習や低消費電力の推論の可能性を示すことで、エッジ・コンピューティングにおける人工知能(AI)技術の発展に貢献。
東京大学 大学院工学系研究科 電気系工学専攻の名幸 瑛心 大学院生、Kasidit Toprasertpong(トープラサートポン・カシディット) 講師、中根 了昌 特任准教授、竹中 充 教授、高木 信一 教授は、JST 戦略的創造研究推進事業の助成のもと、強誘電体トランジスターを用いたリザバー・コンピューティングという機械学習方式を用いて、高精度の音声認識の実証に成功しました。
IT技術に欠かせないAI計算の高効率化と低消費電力化に向けて、AI計算のハードウェア化と高エネルギー効率のAI計算方式の実現が強く求められています。この中で、近年、高エネルギー効率で学習ができ、時系列データ処理が得意な物理リザバー・コンピューティングが注目されていますが、実用性の高いデバイスや実用的な応用に対する高効率な計算方式は確立されていません。
本研究では、音声認識への応用を念頭に、半導体製造プロセスに容易に組み込める酸化ハフニウム系強誘電体材料を用いた強誘電体トランジスター(FeFET)を使った、並列データ処理による物理リザバー・コンピューティングの新しい方式を提案しました。0から9までの数字の英語による音声発話に対する数字認識のタスクに対して、FeFETのドレイン電流、ソース電流、基板電流の3つの電流成分の時間応答を組み合わせる方式を採用し、応答を測定する時間刻みの最適化、時系列アナログ入力信号の適用、異なる周波数チャンネルの組み合わせなどのさまざまな工夫を盛り込むことにより、認識精度が大幅に向上できることを実験的に示しました。結果として、上記の0から9までの数字の音声認識において、ソフトウェアを使ったリザバー計算に匹敵する、95.9パーセントの認識精度を実証しました。
本研究成果は、学習負荷が軽く時系列情報処理に向いた物理リザバー・コンピューティングの実用化、特にエッジ・コンピューティング・システムへの応用の方向性を具体的に示しており、人工知能活用社会を支えるAIハードウェア・システム技術の革新へ向けた有力な選択肢として、今後の発展が強く期待されます。 本研究成果は、2022年6月12日(ハワイ時間)に国際会議Symposia on VLSI Technology and Circuitsで発行される「Technical Digest」に掲載されます。