メディアドライブ製品は、OCR技術をはじめに先端技術にいたる多彩なライブラリで高付加価値システムの実現をサポートします。



テキスト音声自動照合

テキスト音声自動照合

テロップ自動表示などを目的として、自動的に原稿テキストを音声データと同期させるライブラリ


製品の使用目的

CrossMediator Basicの拡張オプションです。CrossMediator Basicの音声検索では、1単語/1文をクエリーとして音声データから検索することができます。テキスト音声自動照合ライブラリでは、さらに文の順序性を利用することで、原稿全体を音声データと照合し、各文と音声との時間的な対応関係を見つけます。
実際の音声と原稿のテキストは厳密に一致する必要がなく、誤文、脱文などがあっても柔軟に照合させることができます。
 このライブラリの応用分野としては、ニュース、ドキュメンタリー、ドラマなどのテレビ番組の字幕表示が考えられます。また、英語にも対応していますので英日翻訳ソフトを併用することで、自動的に洋画などに日本語字幕を挿入するシステムを構築することもできます。

製品の応用例

「ニュース番組(日本語)字幕提示システム」イメージ画像

これは、テキスト音声自動照合ライブラリを用いて、あらかじめ録画した番組に字幕を付けて再生する例です。録画した番組から取り出された音声データと台本との照合を行うことによって、台本各文と映像の最適な時間対応関係(イメージ画像中の字幕提示の開始時間と終了時間)が得られます。イメージ画像は、映像と同期して字幕(イメージ画像中の一番下のエリア)提示する様子を示しています。

テキスト音声自動照合

製品の仕様

入出力形式
入力音声は無圧縮PCM(リニアPCM)形式、サンプリング周波数16KHz以上、モノラル/ステレオ。日本語/英語に対応。
※ 音声のデコードおよびフォーマット変換等のライブラリについてはお客様側でご用意ください。
実行環境
対応プラットフォーム
・Windows XP
・Windows Vista
・Windows 7
・Windows 8.1 (32ビット/64ビット)
・Windows Server 2003 (32ビット/64ビット)
・Windows Server 2008 (32ビッ/64ビットト)
・Windows Server 2008 R2(64ビット)
・Windows Server 2012 (64ビット)
・Windows Server 2012 R2 (64ビット)

※64bit版OSでは32bit互換モード(WOW64)で動作します。その他の64bit版OS、Windows 7 XPモード等の仮想環境、Macintoshは動作保証外。
※Windows 8 はデスクトップアプリケーションとして動作(Windows RTは動作保証外)。
※日本語版に対応
※その他のOSは、個別にご相談ください。
対応機種
上記OSが正常に動作する機種
開発環境
提供形態
ダイナミックリンク ライブラリ
インポート ライブラリ
C/C++用ヘッダーファイル
API呼び出し形式
すべてのAPIはC言語形式となっています。(stdcall)
その他
内部ではマルチスレッドを使用していませんが、再入可能となっていますので、アプリケーションとしてはマルチスレッドが可能です。
但し、内部で同時実行スレッド数などの検査は行っていません


その他

※本ライブラリは新情報処理開発機構の研究成果を使用しております。