テキスト音声自動照合
テロップ自動表示などを目的として、自動的に原稿テキストを音声データと同期させるライブラリ。
製品の使用目的
CrossMediator Basicの拡張オプションです。CrossMediator Basicの音声検索では、1単語/1文をクエリーとして音声データから検索することができます。テキスト音声自動照合ライブラリでは、さらに文の順序性を利用することで、原稿全体を音声データと照合し、各文と音声との時間的な対応関係を見つけます。
実際の音声と原稿のテキストは厳密に一致する必要がなく、誤文、脱文などがあっても柔軟に照合させることができます。
このライブラリの応用分野としては、ニュース、ドキュメンタリー、ドラマなどのテレビ番組の字幕表示が考えられます。また、英語にも対応していますので英日翻訳ソフトを併用することで、自動的に洋画などに日本語字幕を挿入するシステムを構築することもできます。
実際の音声と原稿のテキストは厳密に一致する必要がなく、誤文、脱文などがあっても柔軟に照合させることができます。
このライブラリの応用分野としては、ニュース、ドキュメンタリー、ドラマなどのテレビ番組の字幕表示が考えられます。また、英語にも対応していますので英日翻訳ソフトを併用することで、自動的に洋画などに日本語字幕を挿入するシステムを構築することもできます。
製品の応用例
「ニュース番組(日本語)字幕提示システム」イメージ画像
これは、テキスト音声自動照合ライブラリを用いて、あらかじめ録画した番組に字幕を付けて再生する例です。録画した番組から取り出された音声データと台本との照合を行うことによって、台本各文と映像の最適な時間対応関係(イメージ画像中の字幕提示の開始時間と終了時間)が得られます。イメージ画像は、映像と同期して字幕(イメージ画像中の一番下のエリア)提示する様子を示しています。
これは、テキスト音声自動照合ライブラリを用いて、あらかじめ録画した番組に字幕を付けて再生する例です。録画した番組から取り出された音声データと台本との照合を行うことによって、台本各文と映像の最適な時間対応関係(イメージ画像中の字幕提示の開始時間と終了時間)が得られます。イメージ画像は、映像と同期して字幕(イメージ画像中の一番下のエリア)提示する様子を示しています。
製品の仕様
|
|||||||||||||||
その他
※本ライブラリは新情報処理開発機構の研究成果を使用しております。
