HOME > 商品情報 > ライブラリ > 画像・音声・文書検索 > CrossMediator Basic > 商品紹介

CrossMediator Basic v.3.0 動画・音声検索ライブラリ

ビデオデータから発言/セリフの検索(音声検索)、ビデオデータから好きなCMの検索(動画検索)、ビデオクリップで本編の頭出し(動画検索)、曲名は判らないけど曲を見つけたい(ハミング検索)等の機能をお客様のアプリケーションに組込みたい時、本ライブラリをご利用ください。

商品の使用目的

ビデオデータから発言/セリフの検索(音声検索)
ビデオデータから好きなCMの検索(動画検索)
ビデオクリップで本編の頭出し(動画検索)
曲名は判らないけど曲を見つけたい(ハミング検索)
等の機能をお客様のアプリケーションに組込みたい時、本ライブラリをご利用ください。

商品の特徴

■音声検索
1.音声ストリーム中(動画も可能)の発言から、テキストをクエリーとして発話場所を見つけ出す。
2.音声ストリーム中(動画も可能)の発言から、短い音声(マイク入力など)をクエリーとして発話場所を見つけ出す。
3.テキストデータを音声で見つけ出す。
4.音声認識とは異なり単語辞書を使用しないため、特定分野に限定されない検索が可能。
5.男女を問わず不特定話者の検索が可能。

■ハミング検索
音声ストリーム中のメロディーを、ハミング音声(マイク入力など)をクエリーとしてメロディーの頭だしをする。

■動画検索
1.動画(フレーム)ストリームから短い動画をクエリーとして先頭を見つけ出す。
2.動画(フレーム)ストリームから静止画をクエリーとして先頭を見つけ出す。

※注意事項
音声検索においては会話の背景にBGM、拍手、他人の会話がかぶっているなど発音が明瞭でない部分は検索できない事もあります。

商品の応用例

■様々な応用が考えられます
・ビデオコンテンツ配信におけるコンテンツ検索
・ビデオ会議を発言で検索

商品の仕様

入出力形式
音声検索
入力音声は無圧縮PCM(リニアPCM)形式、サンプリング周波数16KHz以上、モノラル/ステレオ。日本語/英語に対応。
ハミング検索
入力音声は無圧縮PCM(リニアPCM)形式。サンプリング周波数16KHz以上、モノラル/ステレオ音声。
動画検索
入力画像は無圧縮フレーム画像。
※ 音声、動画のデコードおよびフォーマット変換等のライブラリについてはお客様側でご用意ください。
実行環境
Windows XP
※日本語版に対応
※ その他のOSは、個別にご相談ください。
対応機種
上記OSが正常に動作する機種
開発環境
提供形態
ダイナミックリンク ライブラリ
インポート ライブラリ
C/C++用ヘッダーファイル
API呼び出し形式
すべてのAPIはC言語形式となっています。(stdcall)
その他
内部ではマルチスレッドを使用していませんが、再入可能となっていますので、アプリケーションとしてはマルチスレッドが可能です。

その他

※本ライブラリは新情報処理開発機構の研究成果を使用しております。

高精度のOCR商品ならメディアドライブ
| ホーム | トピックス | 商品情報 | 企業情報 | サポート | お問い合わせ | オンラインショップ |
高精度のOCR商品ならメディアドライブ
| 個人情報保護方針 | 情報セキュリティ基本方針 | サイトポリシー | サイトマップ |
高精度のOCR商品ならメディアドライブ
フッタ