ニュース

NTTコミュニケーション科学基礎研、「オープンハウス2013」明日6日開催

ビッグデータ解析、環境モニタリング技術などデモ展示~NTT京阪奈ビルで

NTTコミュニケーション科学基礎研究所 所長 前田英作氏

 NTTコミュニケーション科学基礎研究所は、6月6日と7日の両日、研究成果を公開する「オープンハウス2013 内覧会」を開催する。オープンハウスではデモ展示など30の研究成果を公開するが、NTTでは、オープンハウス開催に先立って記者向けに7つの研究成果のデモ展示と説明を行った。

 「オープンハウス2013」は、京都府相楽郡精華町にあるNTTコミュニケーション科学基礎研究所で6月6日12:00~17:30、6月7日9:30~16:00の2日間開催される。入場料や事前登録は不要。

 NTTの研究所は現在国内5拠点、海外に1拠点あり、2500名が研究開発に携わる。今回オープンハウスを開催するNTTコミュニケーション科学基礎研究所は120名の研究員が所属し、情報科学と人間科学の両面からのアプローチを行う研究所となっている。信号処理、メディア情報処理、学習・知能・知識、人間科学をひとつの研究所で研究しているのが特徴(前田所長)だという。

 以下では、記者説明会で行われたデモ展示についてご紹介する。

NTTグループの研究所と研究テーマ

ビッグデータ解析のための機械学習研究

 NTTでは、研究所横断的な機械学習・データ科学センタを組織し、ビッグデータ/M2Mの研究開発を行なっている。機械学習技術は、パターン認識、言語処理、ロボット工学、ブレインマシンインターフェイス、バイオインフォマティックス、データマイニングなど、数理統計・最適化理論を利用したデータ解析の土台となる技術を指す。

 NTTグループでは、機械学習技術と、得意とするバッチ型データ処理基盤技術およびオンラインデータ処理基盤技術を活用して、社会課題解決のための新サービス提供を目指して研究開発を行なっている。

 SNSのつぶやきを心理学の手法を取り入れて「気分」を解析することで、ダウ・ジョーンズの株価の上下を予測するという研究の精度が高いことで話題になった。統計は過去しか解析できないが、多種のデータを同時に統計解析することで数値化し“見える化”した予測による意思決定支援が可能になる。例えば、GPSのデータや交通情報、物流情報、映像や天候など多種のデータを関連付けて解析することで、災害時の人の動きなどが多面的な把握が可能になり、それをもとに対策を立てるといった支援が考えられている。

 展示では、多種のデータを同時に統計解析し、横断的に現れるパターンを自動抽出する技術の例として、TogetterのデータとTwitterの情報を解析して、任意の検索ワードに対して頻出する単語や、単語をジャンル別に分類して、どういったイメージを持たれているかをグラフなどで視覚化するデモが行われた。デモでは、2009年9月から2013年4月までの35万のTogetterの記事、ツイート数にして約4050万件、語彙数40万種、ユーザー数270万人のデータを解析。記事数と閲覧数が折れ線グラフで表示され、頻出単語は頻度の高いものほど大きく表示されるなど、視覚的に把握できる。単語はジャンル分けされて円グラフでパーセンテージ表示される。関連のツイートの中で影響力が大きいツイッターIDも棒グラフで表示され、関連するtogetterのまとめ記事も閲覧数の多い順に棒グラフで一覧できるなど、ひとつの単語に関する多面的な情報を得ることができることを示した。

多種類のデータを同時に統計解析するデモが行われた
実際のデモ画面。「サントリー」で検索を行うと、チョコ味の炭酸飲料が多く話題に上がっていることがわかる

物体残効錯視の発見

 実際に体験して、最もインパクトが大きいのが錯視のデモだ。NTTコミュニケーション科学基礎研究所では「ある画像を見続けるだけで、その後に見るモノの形や質感の近くが劇的に変わる」錯視を発見。この錯視を「物体残効」と呼ぶが、これまで脳が複雑な物体を認識するには二次元の映像から三次元の形状を“復元”することが不可欠と考えられてきたが、この物体残効錯視が発見されたことで、脳が二次元画像の特徴の寄せ集めから物体を認識するメカニズムを持っていることが明らかになったという。

 デモでは、りんごと梨が点滅表示される画面を使用。りんごと梨の画像が点滅する間、りんごと梨の間に表示されている点を凝視していると、その後にりんごと梨の特徴を併せ持つ同じモノが2つ並んだ画像を見ても、後で表示さ同一のモノが実際とはまったく違う形や質感を持ったモノに見えるというもの。

 左側にりんご、右に梨が点滅表示された後に表示される物体は、2つとも同じものだが、りんごと梨の特徴を併せ持つ。点滅表示された画像に順応した後に見ると、同じはずのものが、左は梨の特徴が強く、右はりんごの特徴が強く見えるが、これは点滅で繰り返し見た絵に順応した結果、順応した特徴が弱められるためだという。動画をご提供いただいたので動画で確認してみていただきたい。

 このメカニズムを利用することで、たとえば映画のCGを使ったシーンで隅々まで3D CGで描画するには時間とコストがかかるが、錯視によって実際には単純な物体をリアルな3D CGのように見せるといった応用が考えられるという。

物体残効錯視の説明ボード
上の画像でりんごと梨が点滅する画面で真ん中の点を凝視した後で下の画面が表示されると、2つの同じ物体がまったく違うものに見える

□物体残効錯視のデモ動画

(動画提供:日本電信電話株式会社 NTTコミュニケーション科学基礎研究所 主任研究員 本吉 勇 氏)

仮名交換による位置プライバシーの保護

 位置情報の活用が盛んになる一方で、プライバシーの保護が課題となっている。仮名交換による位置プライバシーの保護技術は、同じ場所に居合わせたユーザー同士がランダムに仮名を交換することで、長期的な位置プライバシーの保護と短期的な位置情報の有効利用の両立を可能にするもの。

 個人が完全に識別できるデータはきめ細かなサービスが可能である半面、位置プライバシーの保護がない。逆に個人識別情報を除去した位置データでは位置プライバシーは保護される半面、きめ細かいサービスが不可能になる。

 一方で、ユーザー側は一日の行動をすべて把握されるようなトラッキングには危惧を持つ人が多いが、TwitterなどのSNSで「いまここにいます」と現在地をつぶやくなど、特定のポイントだけや短い時間の履歴であれば抵抗が少ないという傾向がある。

 仮名交換の技術は、個人識別情報と位置データが把握できる期間を短い一定時間内に止めることで、きめ細かなサービスとプライバシーの保護の両立を可能にするもの。サービス事業者がAPIなどにより他社に情報を提供するなどの連携が今後さらに増えてくると思われるが、個人と紐付けられた位置データをプラットフォーム的に提供する場合などでの実用化が想定されている。

同じ場所に居合わせたユーザー同士でランダムに仮名を交換する
仮名交換のしくみ

環境データを効率的に集める圧縮技術

 農業ICTなどで、多くのセンサを設置し、環境データを取得して情報の分析を行うことで生産性向上を実現する環境モニタリング技術が注目され、実証実験も各所で行われている。こうしたセンシングにおいては、日照、温度、湿度、土壌の温度や湿度センサーなど多数のセンサから高頻度でデータ集約機器にデータ送信することが必要となる。

 この場合、課題となるのがセンサの電池の持ち時間で、大量設置したセンサの電池切れが頻繁に起こると維持管理が困難になる。CS研で開発されたのは、電池の持ちを良くするためのデータ圧縮技術で、多数設置されたセンサのデータで近似のデータがある場合に、データを間引いて送信し、近似データで補完するアルゴリズムを開発。開発された圧縮アルゴリズムは少ないメモリ、計算パワーでも計算可能な点も特徴で、16bitのCPUも使われるなど一般的に計算能力が極めて非力であるセンサノードでも計算可能だという。

環境モニタリングにおいて多数使用されるセンサ類の電池の持ちを改善するためのデータ圧縮技術
相関性の高いデータがある場合にはデータを間引いて送信することで電力消費を低減。間引いたデータは似たデータを使って復元する

音声認識や翻訳の精度を高める技術など

 音声認識技術では、一般的ではない専門用語が頻出するため認識が難しいとされる大学の講義を例に、音声認識の精度を高める技術を紹介。デモでは、MITの複数の話者の講義100時間分のデータを元に、言葉と無関係な特徴を除去し、さらに認識に不要な特徴を除去。認識結果で間違った箇所を判定して、間違えた場所を区別しやすくなるよう自動再調整する。これにより、従来32.6%だった単語エラー率を20.6%までに低減させることができたという。

 NTTでは、大学の講義のように、自然な発話でさらに専門擁護が頻出するようなサンプルを用いて研究開発を進めることで、誰がどのように話しても正確に聞き取れる音声技術の開発を進めている。これにより、対話型エージェント技術など様々なIT機器を自然に話すことで操作できるような社会の実現を目指す。

従来の方法に比べ、単語エラー率が大きく低減した
大量の音声データから言葉と関係のない特徴を除去し、誤りを推定し、自動再調整する。リアルタイムでの字幕表示も可能

 また、翻訳技術では、日本語は英語や中国語と語順が大きく異なる点に着目し、中国語や英語の原文を、まず日本語と同じ語順に並べ替えた上で、単語を翻訳することで翻訳精度を高める技術が紹介された。これにより、現在ニーズが高まっている中国語で書かれた技術仕様書を高い精度で日本語に自動翻訳するといった実用での利用が可能になる。

中国語は日本語と語順が大きく異なることから、まず語順を日本語と同じ順番に並べ替える
デモ画面。下のテキストは、一番上が中国語の原文、次が中国語を日本語の語順に並べ替えた文、3番目が語順を並べ替えた文を日本語に訳したもの。一番下の文は従来の翻訳エンジンで翻訳した文で、語順を入れ替えて翻訳した3番目の方が自然で誤訳が少ない

 日本人の英語をネイティブの英語に近づける音声処理技術のデモも披露された。この技術では、日本人が英語を話した時の抑揚が平坦であるのに比べて、ネイティブの英語では重要な単語を強調するなどの独特のリズムがあるという違いに着目。ネィティブの録音をもとに音声信号から発話リズムを高い精度で抽出するアルゴリズム「非負値時空間分解法」を開発し、日本人の英語音声を、発話リズムを変換することでネイティブに近い英語音声を自動で作り出すことを可能にした。下敷きとなるネイティブの音声が必要となるため、英語学習など内容があらかじめ決まったシーンでの利用に限られるが、実用化が期待される基礎技術だという。

ネイティブによる英語音声をもとにリズムを解析し、同じ内容の日本人の発話をネイティブに近いリズムに変換する
発話リズムの抽出法

(工藤 ひろえ)