OCRソフトウェアメーカー「メディアドライブ株式会社」は、認識精度の高い活字文書OCRや手書帳票OCR商品をご提供いたします。



HOME > 商品情報 > ライブラリ > 音声認識 > 製品概要
音声認識

音声認識

自適応化HMM(Hidden Markov Model)学習による高精度連続音声認識システム。
日本語連続音声を読み取り、音響モデル、言語モデル等の知識を利用して音声入力をテキストに変換して出力します。

※HMM方式
HMMはHidden Markov Modelの略で、確率モデルのひとつであり、観測されない(隠れた)状態をもつマルコフ過程のこと。 (wikipedia参照)


高精度な日本語連続音声認識

大語彙(だいごい)約30万単語に対応し、高精度に日本語連続音声を認識します。日本語連続音声を読み取り、音響モデル、言語モデル等の知識を利用して音声入力をテキストに変換して出力します。

音声認識 音響モデル 言語モデル 大語彙 テキスト変換

詳細な音声認識結果情報を出力

各単語に対して、認識結果/スコア/時刻情報を出力します。認識結果の最上位候補に誤りがある場合に、第2位以下の候補から正しい発音単語を選択して修正することが容易にできるようになります。

音声認識結果 スコア 時刻情報 テキスト出力

音声認識精度向上のための学習機能 (オプション)

音響モデルや言語モデルの学習機能により、話者や使用環境に適応させることができます。

音声認識の活用事例 「会議議事録の作成」

会議の録音音声を音声認識エンジンで認識。認識の誤りを認識結果修正ツールで修正して、会議事録を作成します。

音声認識 会議議事録の作成

音声認識の活用事例 「ニュース番組などのキーワード検索」

ニュースなどのTV番組を音声認識エンジンでテキスト化し、認識結果からキーワードを検索する。認識結果の候補を使うことにより、検索精度が更に向上します。

音声認識 テキスト検索

音声認識の活用事例 「スマートフォンでの音声認識」

スマートフォンで認識したい言葉を話し、クラウド側で音声認識し、認識結果をスマートフォンに返します。

音声認識 スマートフォン クラウド

その他

本商品は産業技術総合研究所の研究成果を利用しています。