日立グループ、音声・画像・テキストの「ハイブリッド検索ソリューション」


ハイブリッド検索ソリューションのシステム構成例

 株式会社日立システムアンドサービス(以下、日立システム)と日立アイ・エヌ・エス・ソフトウェア株式会社(以下、日立INS)は29日、映像などの動画ファイルから音声・画像・テキストを検索できる次世代「ハイブリッド検索ソリューション」を発表した。7月1日より販売する。

 日立INSの音声検索ソリューション「Voice Searcher(ボイスサーチャー)」、日立システムの「画像検索ソリューション」および全文検索ソリューション「InWeave Search(インウィーブ サーチ)」を連携させた次世代検索ソリューション。映像などの動画ファイルから数秒で音声・画像・テキストを検索できるという。

 音声・画像・動画・文書コンテンツの特徴量を自動生成し、それを用いて検索するため、事前のキーワード付与作業を行わずに検索できる。この際、音声コンテンツに対してはテキストが、画像・動画コンテンツに対しては画像が検索キーとなる。

 音声検索では、音素の記号列と音声特徴量による検索方式を組み合わせ、多段階の照合を行うことで、2000時間分のデータから約3秒という速さで検索可能。ユーザーはテキスト検索と同じ感覚で、任意の文字列をキーワードに音声データや音声付き映像データの発話シーンを検索できるという。

 画像検索では、画像データから画像特徴量(色分布や輝度こう配パターン分布などを数値ベクトル化したもの)を自動生成し、それを基に類似検索する。数千万件の画像データから約1秒で類似した画像を検索でき、形重視や色重視などを指定して検索することも可能。

 テキスト検索では、n-gram方式による全文検索エンジンを活用。1千万件のデータを約0.1秒で検索でき、通常のキーワード検索以外に、類似した内容の文書を検索する「自然文検索」、更新日やURLなどを入力して文書を検索する「プロパティ検索」に対応する。エンタープライズサーチ機能により、システム内のコンテンツと社内外のフィード情報を横断的に検索することも可能。

 販売は、日立システムと日立INSが共同で実施。顧客の課題を洗い出し、各種検索技術の最適な組み合わせを検討するコンサルティングからシステム構築まで、ワンストップの導入支援サービスも提供する。販売目標は今後3年間で20億円。

関連情報
(川島 弘之)
2010/6/29 17:07