ニュース

NTTがR&Dへの取り組みを説明、島田明社長がtsuzumiとIOWNの進捗状況などを公開

 日本電信電話株式会社(以下、NTT)は11月14日~17日に、同社グループの最新研究開発成果を公開する「NTT R&D FORUM 2023」を、東京都武蔵野市のNTT武蔵野研究開発センタで開催。同社独自の生成AI大規模言語モデル「tsuzumi」や、次世代コミュニケーション基盤構想「IOWN」を中心に約100テーマの展示を行っており、要素技術だけでなく、具体的なサービスやユースケースなどを紹介している。

 これにあわせて、開催前日の11月13日に、NTTの島田明社長による「挑む 人と地球のために NTT R&D の取り組み」と題した基調講演が行われ、tsuzumiとIOWNの進捗状況などについて説明した。

NTT 代表取締役社長の島田明氏

 島田社長は、「日本には、労働力不足、環境・エネルギー問題、高齢化/医療費増大/ウェルビーイングの追求といった社会課題があるが、これを解決するのが、大容量、低遅延、低消費電力を実現する次世代コミュニケーション基盤であるIOWNと、世界トップクラスの言語処理能力を持つ小型、省電力の大規模言語モデルのtsuzumiを中心とするNTTのR&Dになる」と自信を見せた。

社会が抱える課題
NTTのR&Dで社会課題を解決

 IOWNについては、電力効率100倍、伝送容量125倍、遅延は1/200という目標を掲げていること、IOWN1.0をすでに商用化し、2025年度にはIOWN 2.0として、ボード接続用光電融合デバイスを開発すること、2028年度にはチップ間向けデバイスを開発することでIOWN3.0に進化。2032年度にはチップ内を光化するIOWN 4.0をリリースするロードマップを、あらためて紹介した。

IOWNの利点
IOWNロードマップ

 特に、IOWN 2.0に関しては時間を割いて説明。光電融合デバイスを「コンピューティング領域に適用するものであり、それを実現する鍵になるのが、大容量、低電力、小型の光エンジンとなる。光エンジンと、これを搭載したスイッチボードを利用し、xPUやメモリ間を、電気ではなく光で接続することで、超低消費電力なIOWNコンピューティングを実現できる。電力効率は従来比8倍にまで引き上げることができる点も特徴だ」と述べるとともに、「光エンジンの開発はおおむね完了している。商用化に向けた試験を実施しているところであり、2025年度には、光エンジンを搭載したスイッチボードを予定通りに提供する」と語った。

IOWN2.0 コンピューティング領域へ
開発中の光エンジン
光エンジンを搭載したスイッチボード

 2025年に開催予定の大阪・関西万博において、IOWN 2.0を体験できる環境を用意することにも言及。「NTTパビリオンの建築テーマは『感情をまとう建築』であり、パビリオンをまとう布が、来場者の盛り上がりに応じて動く仕掛けにするなど、生きているパビリオンを目指している。ここにIOWN APN(オールフォトニクス・ネットワーク)とIOWNコンピュータを利用し、遠隔でAI解析を行う予定である」と語った。

IOWN in 大阪・関西万博
大阪・関西万博のNTTパビリオンではIOWN 2.0が体験できるという。写真はNTTパビリオンの模型

 一方、tsuzumiについては、40年以上の自然言語処理研究をベースにし、日本語では世界トップクラスとなる「言語対応力」、超軽量や低消費電力、高性能を実現した「高いコストパフォーマンス」、低コストでチューニングができる柔軟な「カスタマイズ対応」、日本初となる図表読解などが可能な「マルチモーダル」に特徴があることを強調。6億パラメータの超軽量版と、70億パラメータの軽量版を用意しており、2023年10月から社内外でのトライアルを開始し、効果が出始めていることや、2024年3月には商用提供を開始することにも触れた。

NTT版LLMの特長

 IOWNとtsuzumiによる社会課題解決に向けた、いくつかのユースケースについても説明した。このなかには、新たな事例も含まれている。

 IOWNに関しては、建設機械の遠隔操作システムにAPNを利用し、建設業界で深刻化する労働力不足の解消に貢献している事例を紹介。EARTHBRAINおよびジザイエ、竹中工務店との協業では、大容量、低遅延のIOWNの特長を生かして、遠隔操作でありながらも、現場で建設機械を操作しているような環境が実現できているという。

IOWNによる建設機械の遠隔操作
NTTとEARTHBRAINの協業によるAPNを活用した建設機械の遠隔操作のデモンストレーション

 ソニーとの協業では、放送局とスタジアムなどの現場を、APNで接続したリモートプロダクションを実現。これまではスタジアムなどからの中継には、現場に制作スペースを確保し、多くの人員配置、大規模な放送機材の搬入や中継車の用意などが必要だったが、APNで各地のスタジアムと放送局を接続することで、コンテンツ制作は遠隔で実施。現場には最低限のリソースだけで済むため、運用費や機材費を削減できるメリットが生まれているという。この内容については、11月13日に正式に発表している。

IOWNによるリモートプロダクションの推進

 tsuzumiでは、東京海上日動火災保険における、コンタクトセンターの生産性向上への先行的な取り組みを紹介。同社の事故対応部門において、全国で1万人を超えるオペレーターが、通話後に行う事務作業にtsuzumi を活用することで工数を効率化。年間40万時間の削減を目指しているという。

「tsuzumi」によるコンタクトセンターでの生産性向上

 また、京都大学医学部附属病院では、tsuzumiの活用により、医師が記録した医療データを読解し、共通フォーマットに適切な表現で配置し、分析できる状態で保存。電子カルテの構造化を実現することで、パーソナライズした医療の提供や、医薬品開発力の向上に貢献することを期待しているという。

LLMを活用した電子カルテの構造化

 環境・エネルギー問題への対応という観点では、データセンターの消費電力に関する課題への対応を挙げた。

 2030年のデータセンターの消費電力は、2018年比で、日本では約6倍、世界では約13倍に増加すると試算されているほか、AIの普及がそれを加速。1750億パラメータを持つGPT-3規模の大規模言語モデルでは、1回あたりの学習に必要な電力は約1300MWhに達し、原発1基の1時間の発電量を超えることを指摘しながら、「データドリブン社会では、データセンターに対するニーズが高まるとともに、AIの進展が加速し、これまで以上に莫大な電力を消費することになる」と発言。「NTTは、APNを活用することで、100km離れたデータセンター間を接続し、分散型データセンターによって、これらの課題を解決できる」とした。

データ量増加に伴うデータセンター消費電力の増加上
AI普及による電力消費は莫大

 これまでのネットワークでは、光回線の各経由地において、光信号から電気信号への光電変換が必要であったため、変換によって発生する遅延が避けられなかったが、APNでは光電変換が不要になるため、すべての通信を高速な光技術で結ぶことができる。APNでデータセンターを結ぶことで、通信遅延の影響を受けないため、郊外にもデータセンターを設置しても、それらをひとつのデータセンターのようにして運用。高価な通信機器を各拠点に設置する必要がないため、コスト削減にも貢献できる。また、光の処理だけを行うため、消費電力の削減効果もあり、データセンターの分散化によって、エネルギーの地産地消も実現できるとしている。

 NTTでは、tsuzumiの開発において、神奈川県横須賀市の研究所にある学習データを、東京・三鷹の研究所にあるGPUクラウドを利用して学習。APNで接続して利用したところ、ローカル環境を比較しても遜色がない学習環境を実現したという。

 また、日本オラクルのOracle Cloudと、NTTグループのデータセンター間をAPNで接続する実証を開始。大事なデータは手元に置きながら、分析に必要なデータだけをクラウド上にリアルタイムに連携させることが可能になっているという。

 さらに、NTTグループの海外データセンター間にAPNを導入しているケースについても触れ、英国および米国では、約100km離れているデータセンター間をひとつのデータセンターとして活用するための実証を開始しており、2023年度中には試験を完了させる予定だという。「今後は、英米だけでなく、アジアなどでも同様の展開を進める」という。

分散型データセンター促進(APN×LLM)
分散型データセンター促進(OracleクラウドとNTTのAPN接続)
分散型データセンター促進(海外データセンター間のAPN接続)

 一方、米自動運転技術ベンダーのMay Mobilityに出資し、国内独占販売権を取得したことを発表。バスやタクシーのドライバー不足の課題を抱える複数の地方自治体との協業を通じて、まずはコミュニティバスによるサービス提供に取り組み、その後、自動運転技術をさまざまな車種に展開することで社会課題解決に貢献することも示した。

自動運転システムの提供

 最後に、島田社長が紹介したのは、DJ MASAさんの事例だ。

 27歳だった2014年にALS(筋萎縮性側索硬化症)と診断され、身体が動かせない状況になってしまったDJ MASAさんは、発症した後も、DJ活動をあきらめずに視線操作で音楽を奏でることに挑戦するなど、さまざまな取り組みを開始していた。NTTもこの活動を支援。わずかな筋肉の動きや脳波から意識を読み取る「身体能力転写技術」を活用し、アバターを通じて身体による動きを表現することができたという。また、声が出せないことに対しては、クロスリンガル音声合成技術を活用し、YouTubeなどにあがっていた過去のDJ MASAさんの声を分析し、自分らしい声を再現。これを日本語だけにとどまらず、多言語で会話するといったことも可能にしたという。基調講演では、DJ MASAさんによるパフォーマンスを、海外とつないで実演。大きな盛り上がりを見せた映像を紹介した。

もう一度ステージへ

 島田社長は、NTTの研究開発の成果が、さまざまな形で社会課題を解決していることを示してみせたように、NTT R&D FORUM 2023は、そうした成果を見せる場にすることを目指したものになる。

 一方、NTT 執行役員 研究企画部門長の木下真吾氏は、Sakana AIと共同研究を開始したことを新たに発表した。

NTT 執行役員 研究企画部門長の木下真吾氏

 同社は、Google Brainの日本部門を統括し、Stability AIの研究をリードした経験を持つDavid Ha氏がCEOに就任。ChatGPTなどでも利用されている深層学習モデル「Transformer」の開発者の1人であるLlion Jones氏がCTOとなって設立した企業だ。東京発のスタートアップ企業であり、シリコンバレーからも注目を集めている。

 「小さく賢いAIを連携させるための技術を一緒に開発する。どこまでをNTT、どこまでがSakana AIなのかというわけ方はしていないが、方向性は一致している。最適なAIをどう見つけるのか、AI同士がどう連携するのかといったことを含めて、将来のAIの世界を作り上げていくことになる」と述べた。

Sakana AI社との共同研究開始

 さらに、木下執行役員は、「研究所の3つの覚悟」を宣言。「世界最高峰の研究地位を確立」、「IOWN、LLMの早期かつ確実な実用化」、「研究成果・開発成果を社会へ実装」の3点を挙げた。

世界最高峰の研究地位を確立
IOWN、LLMの早期かつ確実な実用化
研究成果・開発成果を社会へ実装

 前身となる逓信省電気通信研究所の初代所長である吉田五郎氏が、「知の泉を汲んで、研究し、実用化により、世の恵みを具体的に提供しよう」と語ったことを紹介しながら、「70年以上経過しても、これはNTTの研究所のDNAである。この言葉を実現しなくてはならない。3つの覚悟は、吉田氏の言葉にのっとったものである。2023年に、この言葉をあらためて考え、覚悟を決めていく」と述べた。

電気通信研究所の初代所長である吉田五郎氏

 NTTは、論文数ランキングでは、世界で11位、日本で1位であることに加えて、音声認識や情報セキュリティ、光通信分野では世界1位、量子計算機では世界2位の論文数であることを示しながら、「効率の高い研究を進め、2030年には論文数ランキングでトップ5に入る。また、世界一の領域も増やしていくことになる」と意欲を見せた。

 また、社会実装に向けて、2023年6月に、研究開発マーケティング本部を設置したことに触れ、「研究機関部門だけでなく、マーケティングやアライアンスを専門に行う部門を設置し、社会実装を加速する」と述べた。

新体制:研究開発マーケティング本部体制