ニュース

会話音声データを高精度にテキスト化――、日立が「音声書き起こし支援サービス」を提供

 株式会社日立製作所(以下、日立)は16日、デジタル対話サービスの第2弾として、会話音声をテキスト化する「音声書き起こし支援サービス」を、同日より販売開始すると発表した。価格は個別見積もりで、10月31日より提供開始する予定。

 「音声書き起こし支援サービス」は、さまざまな業種における会議・商談などの会話音声をテキスト化するクラウドサービス。音声認識技術を利用し、会話音声データを高精度にテキスト化できるほか、テキスト化されたデータの編集も可能という。

 テキスト化にあたっては、雑音や反響音を除去して認識対象の音声のみを抽出する雑音除去技術と、複数方向からの音声を別々に認識する音源分離技術を活用することで、雑音や複数話者の音声が含まれている音声データでも高精度なテキスト化が可能とした。

 また従来は、口元とマイクの距離が大きく離れると音声認識率が低下するため、精度の高い音声認識を行うためには一人一人にマイク設備を用意して録音する必要があった。しかし、音源方向を特定する日立の技術を組み込んだマイクであれば、1つのマイクで録音した音声データであっても音源方向から複数話者の音声を識別し、話者ごとのコメントをテキスト化できるという。

 これにより、利用者がマイクを意識しない環境でも高い精度で音声のテキスト化を行えるため、現場の小規模な打ち合わせから主要会議まで、さまざまな場面で議事録などの記録作業を効率化できるとのこと。

 もちろん、一般のマイクやICレコーダー、スマートフォンで録音した音声ファイルについても、クラウドへアップロードすればテキスト化を行ってくれる。

 さらに、認識精度を向上させるために、あらかじめ登録されている一般的な用語に加え、ユーザー自身が単語や例文の表記と読みを登録できる「カスタム言語モデル」を利用可能としている。

 なお日立では今後、先行的な顧客企業との取り組みを日立のデジタルソリューション「Lumada」のユースケースとする考えで、製造現場での設備保全作業の音声記録、医療現場での電子カルテの音声入力などに活用シーンを広げながら幅広く展開することで、新たな価値創出や業務改革を支援するとのことだ。