HOME > 商品情報 > ライブラリ > 画像・音声・文書検索 > CrossMediator Basic > テキスト音声自動照合 > 商品紹介

テキスト音声自動照合

テロップ自動表示などを目的として、自動的に原稿テキストを音声データと同期させるライブラリ。

製品の使用目的

CrossMediator Basicの拡張オプションです。CrossMediator Basicの音声検索では、1単語/1文をクエリーとして音声データから検索することができます。テキスト音声自動照合ライブラリでは、さらに文の順序性を利用することで、原稿全体を音声データと照合し、各文と音声との時間的な対応関係を見つけます。
実際の音声と原稿のテキストは厳密に一致する必要がなく、誤文、脱文などがあっても柔軟に照合させることができます。
 このライブラリの応用分野としては、ニュース、ドキュメンタリー、ドラマなどのテレビ番組の字幕表示が考えられます。また、英語にも対応していますので英日翻訳ソフトを併用することで、自動的に洋画などに日本語字幕を挿入するシステムを構築することもできます。

製品の応用例

「ニュース番組(日本語)字幕提示システム」イメージ画像

これは、テキスト音声自動照合ライブラリを用いて、あらかじめ録画した番組に字幕を付けて再生する例です。録画した番組から取り出された音声データと台本との照合を行うことによって、台本各文と映像の最適な時間対応関係(イメージ画像中の字幕提示の開始時間と終了時間)が得られます。イメージ画像は、映像と同期して字幕(イメージ画像中の一番下のエリア)提示する様子を示しています。

製品の仕様

入出力形式
入力音声は無圧縮PCM(リニアPCM)形式、サンプリング周波数16KHz以上、モノラル/ステレオ。日本語/英語に対応。
※ 音声のデコードおよびフォーマット変換等のライブラリについてはお客様側でご用意ください。
実行環境
対応プラットフォーム
Windows XP
※日本語版に対応
※ その他のOSは、個別にご相談ください。
対応機種
上記OSが正常に動作する機種
開発環境
提供形態
ダイナミックリンク ライブラリ
インポート ライブラリ
C/C++用ヘッダーファイル
API呼び出し形式
すべてのAPIはC言語形式となっています。(stdcall)
その他
内部ではマルチスレッドを使用していませんが、再入可能となっていますので、アプリケーションとしてはマルチスレッドが可能です。
但し、内部で同時実行スレッド数などの検査は行っていません

その他

※本ライブラリは新情報処理開発機構の研究成果を使用しております。

高精度のOCR商品ならメディアドライブ
| ホーム | トピックス | 商品情報 | 企業情報 | サポート | お問い合わせ | オンラインショップ |
高精度のOCR商品ならメディアドライブ
| 個人情報保護方針 | 情報セキュリティ基本方針 | サイトポリシー | サイトマップ |
高精度のOCR商品ならメディアドライブ
フッタ