日立ソリューションズ・テクノロジーの音声テキスト化ソフト、AIを活用した追加学習機能を搭載 - クラウド Watch

　株式会社日立ソリューションズ・テクノロジーは13日、音声テキスト化ソフトウェア「Ruby Dictation」を機能強化すると発表した。専門性の高い単語を容易に学習できるようにすることで、コンタクトセンターなどにおいて、業務を止めることなく、認識率の向上が可能になったという。

　Ruby Dictationは、音声をリアルタイムにテキスト化し、講演や対話の記録作成を支援するソフトウェア。発話音声をリアルタイムにテキスト化できるのみならず、録音音声のテキスト化にも対応する。また、認識結果はテキスト以外にタイムスタンプ、形態素名、信頼度などを含んだメタ情報として得られ、既存システムとの連携にも対応している。

　今回の機能強化では、まず、AIを活用した言語モデルの高速適応手法が導入され、ユーザーによる修正や単語登録を言語モデルへすぐに反映できるようになった。誤認識した部分の修正を即座に言語モデルに反映するという。

　また業務を止めることなく、業務内容や利用シーンに合わせた辞書の切り替えが可能になったほか、用例文を用意しなくとも、専門性の高い単語を登録するだけで、適応する文脈を自動的に推測して認識できるようになったとのこと。

　さらに、音声認識精度を維持しつつモデルサイズを削減する手法を開発し、CPU負荷を50％低減させている。具体的には、リアルタイム音声認識を行う場合に、必要なハードウェアリソースを現行システムの50％に抑制可能。加えて、大量の音声ファイルのテキスト化を行う際にも、必要な処理時間を現行システムの50％に低減できるとしている。