文書分類ライブラリ(e.Document Sorter Library)

画像内に含まれる文字情報、罫線情報、バーコード等で自動分類識別します。

文書分類ライブラリ

「文書分類ライブラリ」は、文書や帳票の種類を識別して分類する技術を搭載したライブラリです。

本ライブラリを使うことで、お客様のソフトウェアや業務システムなどに高精度な分類機能を追加することができます。例えば、ファイリングシステムなどに組み込むことで、文書や帳票を電子化して管理する際のフォルダへの仕分け作業が軽減されますので、これまで以上に効率的なシステムを構築することができます。

製品概要

「文書分類ライブラリ」は、スキャナや複合機などでスキャンされた入力画像とモデル登録された帳票のレイアウト(罫線、文字、バーコード情報)を照合し、その結果を出力します。識別には、罫線、文字(OCR結果)、バーコード/QRコードの情報を利用することができますので、申請書、報告書、議事録などのオフィス文書からアンケート用紙、契約書、FAX注文書など様々な文書や帳票の識別に対応します。
文書分類ライブラリ 概要図


特長

【POINT】 高精度帳票識別を実現!
長年にわたる帳票OCRソフトウェアの開発により培われた識別アルゴリズムで、高精度に帳票の自動分類を実現します。
 
【POINT】 汎用性のあるXMLでの条件設定が可能!
文書や帳票分類、振分の条件設定は汎用性の高いXML(文字列)で設定可能。拡張性に富んだ簡潔なシステムの構築が可能です。
 
【POINT】 最新のプラットフォームに対応
Microsoft Visual Studio 2010による開発が可能です。また、動作環境は、Windows7、Windows Server 2008に対応します。
開発言語はVC10、Visual Studio C# 2010(対象フレームワークは2.0、4.0)
 
【POINT】 短期間・低コストでの導入が可能!
詳細なマニュアルとサンプルプログラム(VC用)を同梱。また、無償の評価版貸出により、ご購入前に識別精度の評価が可能です。
 
【POINT】 柔軟なライセンス(ロイヤリティー)価格体系
お客様の開発ソフトウェアや構築システムに応じて、柔軟なライセンス体系で対応します。


1.OCR識別:高性能活字文書OCRエンジンを搭載

OCRには活字文書OCRソフトウェアで実績のある高性能認識エンジンを搭載しました。OCR認識言語は日本語/英語となります。指定範囲内の識別結果から文字列を高速検索(一致・部分一致)し、文書や帳票を自動分類/振分します。

文書分類 OCR識別


2.罫線識別:高速な文書・帳票識別アルゴリズムを搭載

罫線情報を点や線の特徴としてとらえた高精度な帳票識別アルゴリズムを搭載しました。文書や帳票全体だけでなく、一部のエリアだけを比較対象に指定可能です。四角枠・L字・交差する罫線など抽出し、テンプレート照合により自動分類/振分します。 ※文書や帳票の罫線色は黒または濃色を推奨します。

文書分類 罫線識別


3.バーコード識別:低品質な画質にも対応する高性能認識エンジン搭載

バーコード(JAN、ITF、CODE39、CODE128、NW-7)、QRコードにより、自動分類/振分します。
※マイクロQRには未対応です。
文書分類 バーコード識別


マルチコア対応(Server OS版のみ)

マルチコア環境(2つ以上のプロセッサコアを搭載した環境)では、各コアに並列処理をさせることで高速に処理する機能を搭載しました。
※本機能はServer OS版のみ対応です。
マルチコア対応


価格

文書分類ライブラリ 開発キット 定価 1,000,000円 + 税
文書分類ライブラリ 開発キット 年間保守サービス 定価 200,000円 + 税

※年間保守サービスは初年度必須となります。商品購入時にお申し込みください。
※本ライブラリを使用した商品の配布については別途ライセンス費用が必要となります。
※税額は商品引き渡しおよび役務の提供時における税率に基づいて算出される税額となります。

 
CONTACT
お問い合わせ
製品・サービスについてお気軽にお問い合わせください