文書分類ソフトウェア 「e.Document Sorter」

大量の文書や帳票を自動識別し任意のフォルダへ分類/振り分け
文書分類ソフトウェア e.Document Sorter

文書分類ソフトウェア「e.Document Sorter」で多種多様なドキュメントを効率的に分類・仕分け

スキャナやFAX複合機などでスキャンされた入力画像とモデル登録された文書や帳票のレイアウト(罫線、文字、バーコード情報)を照合し、その結果により自動分類します。識別には、罫線、文字(OCR結果)、バーコード/QRコードの情報を利用することができるので、領収書、請求書、申請書、報告書、議事録、契約書、注文書などさまざまなフォーマットの識別に対応します。「e.Document Sorter」を使用すればドキュメントの自動分類・自動仕分けを実現し、RPAとして業務工数を低減できます。

文書分類ソフトウェア e.Document Sorter イメージ図

特長
 
多種多様な文書の分類が可能

文字情報・罫線情報・バーコード情報の3種類の識別情報とAND、OR機能を自由に組み合わせモデル登録することにより、多種多様な文書や帳票を高精度に指定されたフォルダへ分類することが可能です。

文書分類ソフトウェア e.Document Sorter 分類 識別
 
文書分類可能なドキュメント例

「専門書・学術書」「新聞・雑誌」「教科書・問題集」「仕様書・マニュアル」「契約書・業績表」「営業報告書」「事業報告書」「総会議事録」「取締役会議事録」「定款」「組合員名簿」「議決権行使書」「規約」「見積書・請求書」「受領書・領収書」「受注票・作業指示票」「作業日報・工程表」「勤怠管理票・タイムカード」「問診票・受診票」「注文書・申込書」「アンケート・申込はがき」「入学願書・履修届け」...etc

文書分類ソフトウェア e.Document Sorter ドキュメント例
 
OCR識別による文書分類
OCRには活字文書OCRソフトウェアで実績のある高性能認識エンジンを搭載しました。OCR認識言語は日本語/英語となります。指定範囲内の識別結果から文字列を高速検索(一致・部分一致)し、文書や帳票を自動分類/振分します。
文書分類ソフトウェア e.Document Sorter OCR識別
 
適用事例1
文書や帳票内に含まれる「タイトル」や「名称」をキーにOCR識別を実施し、各タイトルごとに自動分類/振分します。

(例)「決算報告書」「契約書」「会議議事録」をタイトルで分類

e.Document Sorter OCR識別 適用事例

 

適用事例2
文書や帳票内に含まれる「文字列」をキーにOCR識別し、指定した「文字列」が含まれる文書や帳票を自動分類します。
(例)キーワード「○○○○」が含まれる文書を指定のフォルダへ
e.Document Sorter OCR識別 適用事例

 

識別対象領域
OCR識別の対象となる領域(文書全体/任意指定位置)の設定が可能です。
e.Document Sorter OCR識別 識別対象領域

 

条件設定
識別対象となる文字列は、完全一致、部分一致、数量範囲指定など、判定種別が設定できます。また、複数の条件設定を組み合わせた処理が可能です。利用可能な条件式は([and] [or] [not])となります。
例:(条件名1 and 条件名2)and not 条件名3
e.Document Sorter OCR識別 識別対象領域
 
学習機能
OCR識別時の処理性能向上のための文字学習が可能です。認識できない特殊な字体・フォントの認識を可能にします
 
認識対象言語
識別対象言語は漢字(JIS第1水準、第2水準420文字)、ひらがな、カタカナ、 アルファベット、数字、記号等3,700種

 

罫線識別による文書分類
罫線情報を線や交点の特徴でとらえる高精度な罫線識別アルゴリズムを搭載しています。文書や帳票全体だけでなく、一部のエリアを比較対象に指定することも可能です。四角枠・L字・交差する罫線など抽出し、テンプレートのモデル照合により結果を出力します。
※罫線色は黒または濃度の濃い色を推奨します。
文書分類ソフトウェア e.Document Sorter 罫線識別
 
適用事例1
文書や帳票に含まれる「罫線」・「矩形」をキーに罫線識別を実施し、あらかじめモデル登録された帳票と罫線情報が合致する文書や文書を自動抽出します。
(例)「注文書」「OCR注文書」「物品受領書」を罫線情報で分類
e.Document Sorter 罫線識別 適用事例
 
識別対象領域
罫線識別の対象となる領域(文書全体/任意指定位置)の設定が可能です。
e.Document Sorter 罫線識別 識別対象領域

 

モデル設定
罫線識別のモデル登録はベースとなる画像を選択し、任意の名称を付けるだけの簡単設定で、座標値や線分の長さなど細かい設定は不要です。
e.Document Sorter 罫線識別 モデル設定
 
罫線認識
抽出可能な罫線の長さ5mm以上となります。点線は罫線として抽出します。斜め線は罫線として抽出できません。L字またはクロスした部分を使用しているため、直線のみの表は抽出できません。
e.Document Sorter 罫線識別 罫線認識

 

認識交点
識別可能な交点の種類は9種類です。角丸の表も抽出します。
e.Document Sorter 罫線識別 認識交点
 
振り分け精度
識別時に識別対象画像と登録モデルが以下の範囲のものを識別対象とします。
1.画像の縦横比が80%~120%の範囲
2.特徴矩形の縦横比が60%~140%の範囲
原稿サイズの縦横比で20%を超えると不一致、特徴矩形の縦横比が40%を超えると不一致とします。
e.Document Sorter 罫線識別 振り分け精度
補正機能
正立補正機能により、画像全体の傾きは補正されます。画像内の罫線情報については、外側多角形を抽出し、傾き10度~-10度の範囲で傾き補正されます。斜め線は識別対象から外れますが、1.5度~15度の範囲で補正し、検出します。検出可能な罫線の角度は罫線形状により変化します。長い罫線は1.5度、短い罫線は15度となります。
e.Document Sorter 罫線識別 補正機能
識別サンプル
交点が少なすぎるまたは全く無い画像や罫線情報が上下左右対象で特徴値が低い画像、罫線仕様を満たしていない画像に対しては適切な罫線識別が実施できません。この場合、罫線情報による分類ではなく、OCR識別やバーコード識別による分類をお勧めします。
e.Document Sorter 罫線識別 識別サンプル
 

 

バーコード識別による文書分類

低品質な画質にも対応する高性能認識エンジン搭載しています。
バーコード(JAN、ITF、CODE39、CODE128、NW-7)、QRコードが対応となります。
※マイクロQRには未対応

文書分類ソフトウェア e.Document Sorter バーコード識別
適用事例1
文書や帳票に含まれる「バーコード」・「QRコード」をキーに罫線識別を実施し、文書や帳票を自動分類します。
(例)「勤怠管理表」を従業員情報を埋め込んだQRコードで分類
e.Document Sorter バーコード識別 適用事例
識別領域指定
コード識別の対象となる領域(文書や帳票全体/任意指定位置)の設定が可能です。
画像イメージ内のバーコード・QRコードの位置を自動で検出することができます。また、手動で読み取り位置や範囲も指定可能です。
*自動検出は1画像にバーコードまたはQRコードが1つのみの場合に有効です。1画像に複数のコードがある場合は、各コードの位置を領域設定する必要があります。
e.Document Sorter バーコード識別 識別領域指定
 
補正機能
高性能認識エンジンを搭載しておりますので、低品質なバーコードや少し傾きのあるバーコードでも高精度に認識できます。
e.Document Sorter バーコード識別 補正機能
 
認識可能なバーコードの種類
高性能認識エンジンを搭載しておりますので、低品質なバーコードや少し傾きのあるバーコードでも高精度に認識できます。
バーコード : JAN、ITF、CODE39、CODE128、NW-7
QRコード : モデル2 1~40の全バージョン

 

e.Document Sorter バーコード識別 バーコードの種類

 

 
マルチコア対応(Server OS版のみ)
マルチコア環境(2つ以上のプロセッサコアを搭載した環境)では、各コアに並列処理をさせることで高速に処理する機能を搭載しています。
※本機能はServer OS版のみ対応です。
文書分類ソフトウェア e.Document Sorter マルチコア対応

 

画像補正
文書分類・識別を向上させるために、読み込んだ画像を事前に補正する正立補正、傾き補正、ノイズ除去などの画像補正機能を内蔵しています。
文書分類ソフトウェア e.Document Sorter 画像補正
 
リネーム機能
識別後に分類した画像に対して、任意のファイル名による出力が可能です。
文書分類ソフトウェア e.Document Sorter リネーム機能
 
その他の機能
複数フォルダ監視
分類するための画像フォルダは最大8個のフォルダを監視可能です。

 

マルチページTIFF対応
マルチページTIFFに対して、以下の処理が可能です。
・1ページ毎に識別し、振分・分類する。
・先頭1ページのみ識別し、まとめて振分・分類する。
・モデル登録帳票の前後で区切り、別ファイルにて出力する(分割出力)

 

リジェクト機能
識別できない文書や帳票はリジェクト処理として、任意の指定フォルダへ出力することができます。

 

ログ出力機能
画像補正内容、OCR結果、コード識別結果など詳細な識別処理履歴を出力可能です。
仕様
 
仕様
■入力関連
読み込み画像形式 BMP、 TIFF/マルチページTIFF(非圧縮、G3/G4圧縮)、 JPEG、PDF
※画像サイズは最大A3、解像度は200~600dpi、カラーに対応
※縦横の解像度が異なる画像、および、モデル設定プログラムでのPDFは対応外
画像回転 90度/180度/270度/用紙方向自動判別機能
傾き補正 自動傾き補正(最大±10度)

■ 出力画像形式(形式変換)
BMP  
TIFF シングル/マルチページTIFF対応
非圧縮、G3/G4圧縮から保存形式を選択可能
JPEG 圧縮率を設定可能
PDF 透明テキスト付きPDFへの変換可能(OCR言語は自動、日本語、英語、日英混在から選択)、正立補正の選択可能
※PDF出力は並列化に非対応

■ 振り分けサービス
監視フォルダ数 最大8フォルダ
ページ分割 マルチページが入力された場合の処理
・1ページ毎に分割して出力
・登録モデルの前でファイル分割して出力
・1ページ目のみ識別し、マルチページのまま出力
登録モデル数 1監視フォルダあたり100モデル
出力ファイル名の変更 以下の情報を使った出力ファイル名称の変更が可能
認識結果、帳票名、取り込み日時、入力ファイル名、拡張子
後処理 任意のプログラムを振り分け後に起動可能

■ 活字認識
認識対象言語 日本語/英語
【日本語認識部】
認識対象文字種 漢字(JIS第1水準、第2水準420文字)、ひらがな、カタカナ、アルファベット、数字、記号等 3700種
認識書体 明朝体、ゴシック体、教科書体等マルチフォント対応
文字サイズ 1.8mm~15mm角程度(5~45ポイント程度)※5ポイントは600dpiスキャン時のみ
推奨文字サイズ
200dpi:5~7mm、14~20 ポイント
300dpi:3.5~5mm、10~14 ポイント
400dpi:3~4mm、9~11 ポイント
600dpi:2~3mm、6~9ポイント
文書形式 縦書き・横書き自動判別、文字サイズ混在文書対応
【英語認識部】
認識対象文字種 アルファベット、数字、記号
認識書体 マルチフォント対応
文字サイズ 1.8mm~15mm角程度(5※~45ポイント程度)※600dpi画像のみ
文書形式 文字サイズ混在文書対応

■ バーコード認識
認識可能なバーコードの種類 JAN、ITF、CODE39、CODE128、NW-7
コード幅 150mm以下
コード高さ 8.0mm以上
細バー(細スペース)*1 サイズ 2画素以上、FAX 画像の場合は3画素以上
2画素は0.25mm(200dpi)/0.17mm(300dpi)/0.125mm(400dpi)/
0.08mm(600dpi)、3画素は0.375mm(200dpi)/0.25mm(300dpi)/
0.187mm(400dpi)/0.125mm(600dpi)
*1 バーコードを構成する一番細い線またはスペース
余白 3mm×[倍率]以上
画像の傾き ±3度以内
画像サイズ A3以下
その他 バーコードの色は黒色(背景は白色)を推奨
300dpi以上を推奨
※ベアラバーありのバーコードには対応しておりません。

■ QRコード認識
モデル モデル2のみ
※モデル1、マイクロQRコードは非対応
バージョン 1~40
※分割表現されたQRコードの連結機能には非対応
モード 数字、英数字、8ビット、漢字、混在
※拡張チャネル、連接、FNC1は非対応
誤り訂正 L,M,Q,H
セル*1サイズ 5×5画素以上、位置検出パターンの■は15×15画素以上
*1 QRコードを構成する最小の■または□の単位
余白 上下左右に4セル以上必要
その他 400dpi以上を推奨
※画像内で指定可能なQRコードは1つのみとなります。

■ 罫線識別
認識罫線 5mm以上
振分け精度 ・L字またはクロスした部分を使用しているため、直線のみの表は抽出できません。
・斜め線は罫線として抽出しません。
・点線を罫線として抽出します。線識別では点線として抽出、点識別では点線と実線は区別しません。
・丸い角の表も抽出します。
・原稿サイズの縦横比で20%を超えると不一致、特徴矩形の縦横比が40%を超えると不一致とします。


動作環境
対応OS 【こちら】をご覧ください
対応機種 上記OSが正常に動作する機種
動作メモリ 4GB以上
必要ハードディスク容量 約70MB以上(e.Document Sorter)
※上記容量に 加えて入力画像ページ数×25MB(A4/カラー/300dpi時)×並列化数の空き容量が必要です。
以下のフォルダに作業ファイルが作成され、ご使用のパソコンによってはCドライブ以外に作成される場合があります。
例:C:\Users\Public\AdsService\Work(Windows Vista以降のOS)
約80MB以上(e.Document Sorter モデル設定プログラム)
その他 アクティベーションを行うためにインターネット接続環境が必要です。
※インターネットに接続できない場合、インターネットに接続可能な別のパソコンを使って代理認証させることができます。

 

価格
 

 

製品名 JAN 価格
e.Document Sorter 4946557021043 220,000円(税込)
e.Document Sorter Server OS 対応版 4946557021951 440,000円(税込)
e.Document Sorter モデル設定 プログラム 4946557022187 110,000円(税込)

 

※モデル登録(テンプレート作成)や振分条件設定には、「e.Document Sorter モデル設定プログラム」が必要です。
※税額は商品引き渡しおよび役務の提供時における税率に基づいて算出される税額となります。

 

リーフレットダウンロード
e.Document Sorterカタログ e.Document SorterのA4カタログです。
ぜひご覧ください。
>> ダウンロードはこちらから

 

 

CONTACT
お問い合わせ
製品・サービスについてお気軽にお問い合わせください