大規模AIクラウド計算システム「ABCI」が「ABCI 2.0」にアップグレード

2021.5.14 更新

ポイント

  • 2021年5月10日13時に「ABCI 2.0」の一般提供をスタート
  • ピーク性能は単精度で226.0ペタフロップス、半精度で851.5ペタフロップスとなり、従来システムの1.5~3倍に
  • 先進的なAI研究開発・応用実証や国内の大規模データ保有企業によるABCIの活用を加速
  • 概要

    国立研究開発法人 産業技術総合研究所【理事長 石村 和彦】(以下「産総研」という)情報・人間工学領域【領域長 関口 智嗣】は、2021年5月10日13時より大規模AIクラウド計算システム「ABCI 2.0」の一般提供をスタートしました。

    従来システムである「AI橋渡しクラウド(AI Bridging Cloud Infrastructure、以下「ABCI」という)」は、わが国の人工知能技術開発の加速を目的として、産総研が設計・開発を行った計算システムで、産総研 柏センターのAIデータセンター棟に導入され、2018年8月に運用を開始しました。これまでに、ABCIを活用した国内企業が、深層学習における世界一の計算速度を達成したことを始め、多くの機関の利用により、顕著な成果を達成しています。また、特徴的な省電力運用への高い関心を寄せられてきました。一方で、運用開始から2年余りを経て、想定を超える高い需要のため、利用を開始できるまでの待ち時間が長いなどの課題がありました。また、大規模なデータ処理が必要となる先進的なAI研究開発・応用実証には、さらに高い計算能力が求められています。

    これらの課題に対し、ABCI 2.0では、ABCIのGPUより高性能で省電力の最新GPUが960基搭載された計算サーバー、およびストレージシステムの増強を行いました。ABCI 2.0は、従来システムと一体で運用されます。この増強により、ピーク性能は、倍精度で56.6ペタフロップス、単精度で226.0ペタフロップス、半精度で851.5ペタフロップスとなり、従来システムに比べ、1.5~3倍のピーク性能となります。また、ストレージ容量は約1.5倍に、理論読み書き性能は約2倍となります。

    経緯

    産総研は、経済産業省「人工知能に関する橋渡しインフラ拡張」(令和元年度補正予算)の一環としてABCIの拡張システムである「AI橋渡しグリーンクラウド基盤(以下、「本拡張システム」という)」を整備しました。本拡張システムは、従来の資産を生かして ABCIと一体となるシステムとして、産総研情報・人間工学領域 人工知能研究センター、産総研・東工大 実社会ビッグデータ活用オープンイノベーションラボラトリ、およびデジタルアーキテクチャ研究センターが設計・開発し、富士通株式会社の技術を採用しました。

    本拡張システムは、2021年3月に導入され、従来システムと結合し、試験運用を経て、2021年5月10日13時より「ABCI 2.0」として一般提供を開始しました。

    「ABCI 2.0」の特長

    1) 最新の高性能・省電力GPUサーバー「計算ノード(A)」 120台「計算ノード(A)」は、高性能で省電力の最新GPU「NVIDIA A100 SXM4」をサーバー1台あたり8基、計960基搭載します。これにより、ABCI 2.0のピーク性能は、倍精度で56.6ペタフロップス(19.3ペタフロップス増)、単精度で226.0ペタフロップス(151.0ペタフロップス増)、半精度で851.5ペタフロップス(300.8ペタフロップス増)となります。これは従来システムに比べ、1.5~3倍のピーク性能となります。

    2) 従来システムとの一体運用を実現する大容量ストレージシステム11.2ペタバイトの大容量ストレージシステムを追加し、すでに稼働している従来システムのストレージシステムとの相互アクセスを可能にすることで、ABCI 2.0としての一体運用を実現しました。この拡張により、従来システムに比べて、ストレージ容量は約1.5倍に、理論読み書き性能は約2倍に増強されます。これにより、従来ストレージの読み書き性能がボトルネックとなっていた大規模なデータ処理の性能向上が期待できます。

    3) 世界トップクラスの省電力運用サーバーと冷却システムの双方が世界トップクラスの省電力性能を持ちます。「計算ノード(A)」は、電力あたり性能が高い最新GPUを搭載しています。冷却システムは、従来システムと同様に、高温になるCPU、GPU、メモリなどの基幹部品をAIデータセンター棟が供給する外気に近い温度の冷却水により直接冷却し、残熱は同じ冷却水を用いた空冷システムにより除きます。このような工夫により、より少ない電力で高性能を発揮できます。


    ※記事の無断転用を禁じます。