ニュース

NTTテクノクロス、ローカル環境で文字起こしや要約を完結できる「VoiceSnap」新版を提供

リアルタイムの文字起こしや辞書の使い分けなどにも対応

 NTTテクノクロス株式会社は26日、テキスト・音声・画像や位置情報など多様なデータを収集・保存・管理し、必要な時にすぐに確認・活用できる仕組みを持つデータプラットフォームソリューション「VoiceSnap(ボイススナップ)」において、ローカルLLMを搭載し、オンプレミス環境での要約処理などに対応した新版を、1月27日より提供開始すると発表した。

 VoiceSnapは、NTTテクノクロスが蓄積してきた音声解析技術とセキュリティのノウハウを用いて、セキュアに文字起こしを行えるソリューション。録音した会議の音声ファイルをアップロードすると、AIが高精度の文字起こしを行うという。

 今回の新版では、情報漏えいの懸念などからオンライン議事録作成サービス等の利用に制約がある企業を支援するため、インターネットに接続せず、LLM(大規模言語モデル)の利用料金が発生しないローカルLLMを製品内に搭載した。ローカルLLMを活用して、オンプレミス環境にあるVoiceSnap内の閉じた環境で対話内容の文字起こしやテキストの要約処理を完結できる。

 また、従来の音声ファイルのアップロードによる処理に加えて、音声をリアルタイムに処理する機能を追加した。個人情報などを扱う機密性の高い打ち合わせの進行と並行してテキスト化を行い、文字起こし結果を生成することができる。これにより、参加者は議論の内容を迅速に把握・共有できるほか、会議の合間や終了後に内容を振り返りやすくなるとのこと。さらに、発言内容の正確な確認や双方の合意が求められる場面では、終了直後に速やかに内容を確認・修正できるとした。

 加えて、専門用語や社内用語を登録して文字起こしの精度向上を図る辞書機能を、利用者が画面上の簡単な操作で自由に登録・管理できるように改善した。会議の内容によって複数の辞書を使い分けられるため、誤変換を減らし、より正確な文字起こしや要約を実現するとしている。