特長
文書分類ソフトウェア「e.Document Sorter」は、長年のOCR技術により培われた認識技術により、高精度な文書や帳票の分類機能を実現します。
多種多様な文書や帳票に対応
文字情報・罫線情報・バーコード情報の3種類の識別情報とAND、OR機能を自由に組み合わせモデル登録することにより、多種多様な文書や帳票を高精度に指定されたフォルダへ分類することが可能です。
文書・帳票例
「専門書・学術書」「新聞・雑誌」「教科書・問題集」「仕様書・マニュアル」「契約書・業績表」「営業報告書」「事業報告書」「総会議事録」「取締役会議事録」「定款」「組合員名簿」「議決権行使書」「規約」「見積書・請求書」「受領書・領収書」「受注票・作業指示票」「作業日報・工程表」「勤怠管理票・タイムカード」「問診票・受診票」「注文書・申込書」「アンケート・申込はがき」「入学願書・履修届け」...etc
1.OCR識別:高性能活字文書OCRエンジンを搭載
OCRには活字文書OCRソフトウェアで実績のある高性能認識エンジンを搭載しました(OCR認識言語は日本語/英語)。指定範囲内の文字を高速認識(一致・部分一致)します。
2.罫線識別:高速な文書・帳票識別アルゴリズムを搭載
罫線情報を線や交点の特徴でとらえる高精度な罫線識別アルゴリズムを搭載しました。文書や帳票全体だけでなく、一部のエリアを比較対象に指定することも可能です。四角枠・L字・交差する罫線など抽出し、テンプレートのモデル照合により結果を出力します。
※罫線色は黒または濃度の濃い色を推奨します。
※罫線色は黒または濃度の濃い色を推奨します。
3.バーコード識別:低品質な画質にも対応する高性能認識エンジン搭載
バーコード(JAN、ITF、CODE39、CODE128、NW-7)、QRコードが対応となります。
※マイクロQRには未対応です。
※マイクロQRには未対応です。
マルチコア対応(Server OS版のみ)
マルチコア環境(2つ以上のプロセッサコアを搭載した環境)では、各コアに並列処理をさせることで高速に処理する機能を搭載しています。
※本機能はServer OS版のみ対応です。
※本機能はServer OS版のみ対応です。
画像補正
分類・識別を向上させるために、読み込んだ画像を事前に補正する正立補正、傾き補正、ノイズ除去などの画像補正機能を内蔵しています。
リネーム機能
識別後に分類した画像に対して、任意のファイル名による出力が可能です。
その他の機能
■複数フォルダ監視
分類するための画像フォルダは最大8個のフォルダを監視可能です。
■マルチページTIFF対応
マルチページTIFFに対して、以下の処理が可能です。
・1ページ毎に識別し、振分・分類する。
・先頭1ページのみ識別し、まとめて振分・分類する。
・モデル登録帳票の前後で区切り、別ファイルにて出力する(分割出力)
■リジェクト機能
識別できない文書や帳票はリジェクト処理として、任意の指定フォルダへ出力することができます。
■ファイル名識別機能
ファイル名による識別が可能です。
■ログ出力機能
画像補正内容、OCR結果、コード識別結果など詳細な識別処理履歴を出力可能です。
分類するための画像フォルダは最大8個のフォルダを監視可能です。
■マルチページTIFF対応
マルチページTIFFに対して、以下の処理が可能です。
・1ページ毎に識別し、振分・分類する。
・先頭1ページのみ識別し、まとめて振分・分類する。
・モデル登録帳票の前後で区切り、別ファイルにて出力する(分割出力)
■リジェクト機能
識別できない文書や帳票はリジェクト処理として、任意の指定フォルダへ出力することができます。
■ファイル名識別機能
ファイル名による識別が可能です。
■ログ出力機能
画像補正内容、OCR結果、コード識別結果など詳細な識別処理履歴を出力可能です。
