OCRソフトウェアメーカー「メディアドライブ株式会社」は、認識精度の高い活字文書OCRや手書帳票OCR商品をご提供いたします。



電話・会議用音声検索

電話・会議用音声検索

電話・会議等の低品質音声に対応した音声検索ライブラリ


製品の使用目的

・CrossMediator Basicの拡張オプションです。CrossMediator Basicの音声検索はニュース音声など比較的良好な音質の音声を対象としていますが、電話・会議用音声検索ライブラリは、電話や会議などの低品質音声を対象としています。
・CrossMediator Basicの音声検索と同様、インデックスが付いていない音声データから自動で音声特徴インデックスを作成し、音声・テキストをクエリーとして検索したり、マイク入力等の音声をクエリーとしテキストデータから検索することができます。

製品の応用先

会議音声の録音データからテキストによるキーワードをクエリーとして検索するプログラムの例です。
テキストでキーワード「新商品」を入力すると、複数の会議音声データを検索して「新商品」と発話した音声が含まれる会議とその発話時刻を表示し、音声を再生します。1つの会議で複数回「新商品」と発話していた場合でも、それぞれ発話した時刻が表示されるので区別することができます。

電話会議用音声検索

製品の仕様

入出力形式
入力音声は無圧縮PCM(リニアPCM)形式、サンプリング周波数8KHz、モノラル/ステレオ。日本語に対応。
※ 音声のデコードおよびフォーマット変換等のライブラリについてはお客様側でご用意ください。
実行環境
対応プラットフォーム
Windows XP、Windows Vista、Windows7
※日本語版に対応
※ その他のOSは、個別にご相談ください。
対応機種
上記OSが正常に動作する機種
開発環境
提供形態
ダイナミックリンク ライブラリ
インポート ライブラリ
C/C++用ヘッダーファイル
API呼び出し形式
すべてのAPIはC言語形式となっています。(stdcall)
その他
内部ではマルチスレッドを使用していませんが、再入可能となっていますので、アプリケーションとしてはマルチスレッドが可能です。
但し、内部で同時実行スレッド数などの検査は行っていません


製品の関連リンク

ネイクス社「通話録音システム」でテキスト入力による通話録音データの検索に利用されています。
ネイクス社 通話録音システム(http://www.neix.co.jp/ja/products/neparrot2.htm)

その他

※本ライブラリは新情報処理開発機構の研究成果を使用しております。