文書分類ソフトウェア 「e.Document Sorter」
大量の文書や帳票を自動識別し任意のフォルダへ分類/振り分け

文書分類ソフトウェア「e.Document Sorter」で多種多様なドキュメントを効率的に分類・仕分け
スキャナやFAX複合機などでスキャンされた入力画像とモデル登録された文書や帳票のレイアウト(罫線、文字、バーコード情報)を照合し、その結果により自動分類します。識別には、罫線、文字(OCR結果)、バーコード/QRコードの情報を利用することができるので、領収書、請求書、申請書、報告書、議事録、契約書、注文書などさまざまなフォーマットの識別に対応します。「e.Document Sorter」を使用すればドキュメントの自動分類・自動仕分けを実現し、RPAとして業務工数を低減できます。


多種多様な文書の分類が可能
文字情報・罫線情報・バーコード情報の3種類の識別情報とAND、OR機能を自由に組み合わせモデル登録することにより、多種多様な文書や帳票を高精度に指定されたフォルダへ分類することが可能です。

文書分類可能なドキュメント例
「専門書・学術書」「新聞・雑誌」「教科書・問題集」「仕様書・マニュアル」「契約書・業績表」「営業報告書」「事業報告書」「総会議事録」「取締役会議事録」「定款」「組合員名簿」「議決権行使書」「規約」「見積書・請求書」「受領書・領収書」「受注票・作業指示票」「作業日報・工程表」「勤怠管理票・タイムカード」「問診票・受診票」「注文書・申込書」「アンケート・申込はがき」「入学願書・履修届け」...etc

OCR識別による文書分類
OCRには活字文書OCRソフトウェアで実績のある高性能認識エンジンを搭載しました。OCR認識言語は日本語/英語となります。指定範囲内の識別結果から文字列を高速検索(一致・部分一致)し、文書や帳票を自動分類/振分します。

適用事例1
文書や帳票内に含まれる「タイトル」や「名称」をキーにOCR識別を実施し、各タイトルごとに自動分類/振分します。
(例)「決算報告書」「契約書」「会議議事録」をタイトルで分類

(例)「決算報告書」「契約書」「会議議事録」をタイトルで分類

適用事例2
文書や帳票内に含まれる「文字列」をキーにOCR識別し、指定した「文字列」が含まれる文書や帳票を自動分類します。
(例)キーワード「○○○○」が含まれる文書を指定のフォルダへ
(例)キーワード「○○○○」が含まれる文書を指定のフォルダへ

識別対象領域
OCR識別の対象となる領域(文書全体/任意指定位置)の設定が可能です。

条件設定
識別対象となる文字列は、完全一致、部分一致、数量範囲指定など、判定種別が設定できます。また、複数の条件設定を組み合わせた処理が可能です。利用可能な条件式は([and] [or] [not])となります。
例:(条件名1 and 条件名2)and not 条件名3
例:(条件名1 and 条件名2)and not 条件名3

学習機能
OCR識別時の処理性能向上のための文字学習が可能です。認識できない特殊な字体・フォントの認識を可能にします
認識対象言語
識別対象言語は漢字(JIS第1水準、第2水準420文字)、ひらがな、カタカナ、 アルファベット、数字、記号等3,700種
罫線識別による文書分類
罫線情報を線や交点の特徴でとらえる高精度な罫線識別アルゴリズムを搭載しています。文書や帳票全体だけでなく、一部のエリアを比較対象に指定することも可能です。四角枠・L字・交差する罫線など抽出し、テンプレートのモデル照合により結果を出力します。
※罫線色は黒または濃度の濃い色を推奨します。
※罫線色は黒または濃度の濃い色を推奨します。

適用事例1
文書や帳票に含まれる「罫線」・「矩形」をキーに罫線識別を実施し、あらかじめモデル登録された帳票と罫線情報が合致する文書や文書を自動抽出します。
(例)「注文書」「OCR注文書」「物品受領書」を罫線情報で分類
(例)「注文書」「OCR注文書」「物品受領書」を罫線情報で分類

識別対象領域
罫線識別の対象となる領域(文書全体/任意指定位置)の設定が可能です。

モデル設定
罫線識別のモデル登録はベースとなる画像を選択し、任意の名称を付けるだけの簡単設定で、座標値や線分の長さなど細かい設定は不要です。

罫線認識
抽出可能な罫線の長さ5mm以上となります。点線は罫線として抽出します。斜め線は罫線として抽出できません。L字またはクロスした部分を使用しているため、直線のみの表は抽出できません。

認識交点
識別可能な交点の種類は9種類です。角丸の表も抽出します。

振り分け精度
識別時に識別対象画像と登録モデルが以下の範囲のものを識別対象とします。
1.画像の縦横比が80%~120%の範囲
2.特徴矩形の縦横比が60%~140%の範囲
原稿サイズの縦横比で20%を超えると不一致、特徴矩形の縦横比が40%を超えると不一致とします。
1.画像の縦横比が80%~120%の範囲
2.特徴矩形の縦横比が60%~140%の範囲
原稿サイズの縦横比で20%を超えると不一致、特徴矩形の縦横比が40%を超えると不一致とします。

補正機能
正立補正機能により、画像全体の傾きは補正されます。画像内の罫線情報については、外側多角形を抽出し、傾き10度~-10度の範囲で傾き補正されます。斜め線は識別対象から外れますが、1.5度~15度の範囲で補正し、検出します。検出可能な罫線の角度は罫線形状により変化します。長い罫線は1.5度、短い罫線は15度となります。

識別サンプル
交点が少なすぎるまたは全く無い画像や罫線情報が上下左右対象で特徴値が低い画像、罫線仕様を満たしていない画像に対しては適切な罫線識別が実施できません。この場合、罫線情報による分類ではなく、OCR識別やバーコード識別による分類をお勧めします。

バーコード識別による文書分類
低品質な画質にも対応する高性能認識エンジン搭載しています。
バーコード(JAN、ITF、CODE39、CODE128、NW-7)、QRコードが対応となります。
※マイクロQRには未対応

適用事例1
文書や帳票に含まれる「バーコード」・「QRコード」をキーに罫線識別を実施し、文書や帳票を自動分類します。
(例)「勤怠管理表」を従業員情報を埋め込んだQRコードで分類
(例)「勤怠管理表」を従業員情報を埋め込んだQRコードで分類

識別領域指定
コード識別の対象となる領域(文書や帳票全体/任意指定位置)の設定が可能です。
画像イメージ内のバーコード・QRコードの位置を自動で検出することができます。また、手動で読み取り位置や範囲も指定可能です。
*自動検出は1画像にバーコードまたはQRコードが1つのみの場合に有効です。1画像に複数のコードがある場合は、各コードの位置を領域設定する必要があります。
画像イメージ内のバーコード・QRコードの位置を自動で検出することができます。また、手動で読み取り位置や範囲も指定可能です。
*自動検出は1画像にバーコードまたはQRコードが1つのみの場合に有効です。1画像に複数のコードがある場合は、各コードの位置を領域設定する必要があります。

補正機能
高性能認識エンジンを搭載しておりますので、低品質なバーコードや少し傾きのあるバーコードでも高精度に認識できます。

認識可能なバーコードの種類
高性能認識エンジンを搭載しておりますので、低品質なバーコードや少し傾きのあるバーコードでも高精度に認識できます。
バーコード : JAN、ITF、CODE39、CODE128、NW-7
QRコード : モデル2 1~40の全バージョン
QRコード : モデル2 1~40の全バージョン

マルチコア対応(Server OS版のみ)
マルチコア環境(2つ以上のプロセッサコアを搭載した環境)では、各コアに並列処理をさせることで高速に処理する機能を搭載しています。
※本機能はServer OS版のみ対応です。
※本機能はServer OS版のみ対応です。

画像補正
文書分類・識別を向上させるために、読み込んだ画像を事前に補正する正立補正、傾き補正、ノイズ除去などの画像補正機能を内蔵しています。

リネーム機能
識別後に分類した画像に対して、任意のファイル名による出力が可能です。

その他の機能
複数フォルダ監視
分類するための画像フォルダは最大8個のフォルダを監視可能です。
マルチページTIFF対応
マルチページTIFFに対して、以下の処理が可能です。
・1ページ毎に識別し、振分・分類する。
・先頭1ページのみ識別し、まとめて振分・分類する。
・モデル登録帳票の前後で区切り、別ファイルにて出力する(分割出力)
・1ページ毎に識別し、振分・分類する。
・先頭1ページのみ識別し、まとめて振分・分類する。
・モデル登録帳票の前後で区切り、別ファイルにて出力する(分割出力)
リジェクト機能
識別できない文書や帳票はリジェクト処理として、任意の指定フォルダへ出力することができます。
ログ出力機能
画像補正内容、OCR結果、コード識別結果など詳細な識別処理履歴を出力可能です。

仕様
■入力関連
■ 出力画像形式(形式変換)
■ 振り分けサービス
■ 活字認識
■ バーコード認識
※ベアラバーありのバーコードには対応しておりません。
■ QRコード認識
※画像内で指定可能なQRコードは1つのみとなります。
■ 罫線識別
|
■ 出力画像形式(形式変換)
|
■ 振り分けサービス
|
■ 活字認識
|
||||||||||||||||||||||
■ バーコード認識
|
■ QRコード認識
|
■ 罫線識別
|
動作環境
|

|
※モデル登録(テンプレート作成)や振分条件設定には、「e.Document Sorter モデル設定プログラム」が必要です。
※税額は商品引き渡しおよび役務の提供時における税率に基づいて算出される税額となります。
リーフレットダウンロード
![]() |
e.Document SorterのA4カタログです。 ぜひご覧ください。 >> ダウンロードはこちらから |
