高精度のOCR商品ならメディアドライブ
高精度のOCR商品ならメディアドライブ メディアドライブロゴマーク 高精度のOCR商品ならメディアドライブ サイトマップ オンラインショップ
  NTTデータグループロゴ  
高精度のOCR商品ならメディアドライブ
ホーム トピックス 商品情報 企業情報 サポート お問い合わせ
高精度のOCR商品ならメディアドライブ
  ホーム > トピックス >  
高精度のOCR商品ならメディアドライブ 高精度のOCR商品ならメディアドライブ 高精度のOCR商品ならメディアドライブ
  トピックス  
高精度のOCR商品ならメディアドライブ 高精度のOCR商品ならメディアドライブ 高精度のOCR商品ならメディアドライブ
 
文書分類ソフトウェア「e.Document Sorter」、システム開発用「文書分類ライブラリ」リリースのご案内
メディアドライブ株式会社
2011年4月8日
メディアドライブ株式会社(代表取締役社長:松村 博 本社:東京都目黒区)は、文書分類ソフトウェア「e.Document Sorter」と、システム開発用の「文書分類ライブラリ」を2011年4月28日に発売致します。

「e.Document Sorter」(イー ドキュメント ソーター)は、スキャナや複合機などでスキャンされた入力画像とモデル登録された文書や帳票のレイアウト(罫線)情報や文字(OCR結果)情報、バーコード/QRコード情報を照合し、その結果により自動的に分類することができます。

識別には、レイアウト(罫線)情報や文字(OCR結果)情報、バーコード/QRコード情報を自由に組み合わせて利用できますので、領収書、請求書、申請書、報告書、議事録、契約書、注文書などの文書や帳票の様々なフォーマットの識別に対応します。



「文書分類ライブラリ」は、お客様のソフトウェアや業務システムなどに文書・帳票分類機能を追加することができるライブラリです。DLL(ダイナミックリンクライブラリ)として提供します。ファイリングシステムなどに組み込むことで、文書や帳票を電子化して管理する際のフォルダへの仕分け作業が軽減されますので、これまで以上に効率的なシステムを構築することができます。

大量の文書・帳票を分類するためのソフトウェアやシステムの開発をご検討されているお客様は、この機会に是非ともご検討ください。また、当社の帳票OCRソフトウェア「FormOCR」や、画像補正/ファイル配信ソフトウェア「イメージマネージャ for FAX-OCR」と組み合わせたカスタマイズも可能ですのでお問い合わせください。


■発売日
2011年4月 28日(木)予定

商品名

定価(税込)

e.Document Sorter

定価200,000円(税込210,000円)

e.Document Sorter 年間保守サービス

定価20,000円(税込21,000円)

e.Document Sorter モデル設定プログラム

定価100,000円(税込105,000円)

e.Document Sorter モデル設定プログラム 年間保守サービス

定価10,000円(税込10,500円)

文書分類ライブラリ 開発キット

定価1,000,000円(税込1,050,000円)

文書分類ライブラリ 開発キット 年間保守サービス

定価200,000円(税込210,000円)


※年間保守サービスは初年度必須となります。商品購入時にお申し込みください。
※サーバーOSに対応した商品も別途用意しております。
※ライブラリを使用した商品の配布については別途ライセンス費用が必要となります。


■主な新機能
(1)帳票の電子化作業を支援

「e.Document Sorter」は複合機等でスキャンされた文書・帳票を、予めモデル登録された帳票のレイアウト(罫線)情報や文字(OCR結果)情報、バーコード/QRコード情報と比較して自動で指定のフォルダに分類します。大量の異なる文書や帳票を電子化する際、事前に仕分けしてからスキャンしたり、あるいは、スキャン後に画像を確認してから移動するなどの作業が不要となり、効率的に電子化作業が行えます。


(2)様々な文書や帳票に対応

帳票内の様々な識別情報を使って振り分けることができます。識別情報はANDやORの論理条件で組み合わせて使うことが可能ですので、領収書、請求書、申請書、報告書、議事録、契約書、注文書などの文書や帳票をはじめ、様々なフォーマットの識別に対応します。

識別の種類 比較方法
活字認識(OCR) 入力画像内の活字を文字認識(OCR)し、認識結果とモデルのキーワードを比較
バーコード認識 入力画像内のバーコードを認識し、認識結果とモデル登録時のキーワードを比較
QRコード認識 入力画像内のQRコードを認識し、認識結果とモデル登録時のキーワードを比較
罫線識別 入力画像内の罫線を抽出し、モデルの罫線情報と比較
画像情報 入力画像のファイル名や解像度、色数の情報を使用

(3)高精度な罫線識別アルゴリズムを搭載

罫線情報を線や交点の特徴とし、高精度な罫線識別アルゴリズムを搭載しました。文書・帳票全体だけでなく、一部のエリアを比較対象に指定することも可能です。四角枠・L字・交差する罫線などを抽出し、テンプレートとのモデル照合により結果を出力します。
※罫線色は黒または濃度の濃い色を推奨します。


(4)高性能活字文書OCRエンジンを搭載

OCRには活字文書OCRソフトウェアで実績のある高性能日本語認識エンジンを搭載しました(OCR認識言語は日本語/英語)。認識箇所は文書や帳票の全体や任意指定位置などの設定が可能です。また、文字の学習機能を用意しておりますので、誤認識された文字を学習させることで、OCR振り分け時の精度を向上させることができます。


(5)バーコード/QRコードによる振り分けが可能

バーコード/QRコード認識は、JAN8/13、ITF、CODE39、CODE128、NW-7、QRコードが対象となります。画像イメージ内のバーコード・QRコードの位置を自動で検出することができます。また、手動で読み取り位置や範囲も指定可能です。自動検出は1画像にバーコードまたはQRコードが1つのみの場合に有効です。1画像に複数のコードがある場合は、各コードの位置を領域設定する必要があります。


(6)マルチコア環境での高速処理を実現

マルチコア環境(2つ以上のプロセッサコアを搭載した環境)では、各コアに並列処理をさせることで高速に処理させることができます。同時に使用するコアの数をお客様が指定することも可能です。
※本機能はサーバー版のみ対応となります。


(7)振り分けデータの後処理機能

振り分け後のデータに対しては、日付や認識結果、指定文字列、連番等を使ってファイル名を変更したり、後処理として他のアプリケーションと連携させることができます。お客様のファイリングシステムなどと組み合わせた利用が可能です。


(8)その他の機能

・識別できない文書や帳票はリジェクト処理可能
・入力画像の自動正立、自動傾き補正、ノイズ除去機能
・照合の判定などに関するログの出力
・マルチページTIFFファイルのページ分割処理


(9)モデル設定プログラム

「e.Document Sorter モデル設定プログラム」(別売)を使用し、比較する元となるモデル帳票を登録します。モデル登録された条件を使って事前の振り分けテストが可能です。振り分け結果だけでなく、文字の認識結果や画像の補正状態等も事前に確認できますので、運用前の事前評価に有効です。




■「e.Document Sorter」仕様

入力関連
読み込み画像形式 BMP、TIFF/マルチページTIFF(非圧縮、G3/G4圧縮)、JPEG
※画像サイズは最大A3、解像度は300〜600dpi、カラーに対応
画像の回転 90度/180度/270度/用紙方向自動判別機能
傾き補正 自動傾き補正(最大±10度)


振り分けサービス
監視フォルダ数 最大8フォルダ
ページ分割 マルチページが入力された場合の処理
(1)1ページ毎に分割して出力
(2)1ページ目のみ識別し、マルチページのまま出力
(3)登録モデルの前でファイル分割して出力(各ページが同一形式の場合のみ対応)
登録モデル数 1監視フォルダあたり100モデル
出力ファイル名の変更

以下の情報を使った出力ファイル名称の変更が可能
認識結果、帳票名、取り込み日時、入力ファイル名、拡張子

後処理 任意のプログラムを振り分け後に起動可能


活字認識(OCR)
認識対象言語 日本語/英語
日本語認識部
認識対象文字 漢字(JIS第1水準、第2水準420文字)、ひらがな、カタカナ、アルファベット、数字、記号等3,700種
認識書体 明朝体、ゴシック体、教科書体等マルチフォント対応
文字サイズ 1.8mm〜15mm角程度(5※〜45ポイント程度)※600dpi画像のみ
文書形式 縦書き・横書き自動判別。文字サイズ混在文書対応
英語認識部
認識対象文字 アルファベット、数字、記号
認識書体 マルチフォント対応
文字サイズ 1.8mm〜15mm角程度(5※〜45ポイント程度)※600dpi画像のみ
文書形式 文字サイズ混在文書対応


バーコード認識
認識可能なバーコードの種類 JAN、ITF、CODE39、CODE128、NW-7
コード幅 150mm以下
コード高さ 8.0mm以上
細バー(細スペース)*1 サイズ 2画素以上
*1 バーコードを構成する一番細い線またはスペース
余白 3mm×[倍率]以上
画像の傾き ±3度以内
画像サイズ A3以下
その他 バーコードの色は黒色(背景は白色)を推奨
※ベアラバーありのバーコードには対応しておりません。画像内で指定可能なバーコードは1つのみとなります。

QRコード認識
モデル 2のみ
※モデル1、マイクロQRコードは非対応
バージョン 1〜40
※分割表現されたQRコードの連結機能には非対応
モード 数字、英数字、8ビット、漢字、混在
※拡張チャネル、連接、FNC1は非対応
誤り訂正 L,M,Q,H
セル*1サイズ 5×5画素以上、位置検出パターンの■は15×15画素以上
*1 QRコードを構成する最小の■または□の単位
余白 上下左右に4セル以上必要
※画像内で指定可能なQRコードは1つのみとなります。

罫線識別
登録帳票数 1リーダーあたり150個までを推奨
認識罫線 内輪郭が有る場合は3mm以上
内輪郭が無い場合は5mm以上
振分け精度 ・L字またはクロスした部分を使用しているため、直線のみの表は抽出できません。
・斜め線は罫線として抽出しません。
・点線を罫線として抽出します。線識別では点線として抽出、点識別では点線と実線は区別しません。
・丸い角の表も抽出します。
・原稿サイズの縦横比で20%を超えると不一致、特徴矩形の縦横比が40%を超えると不一致とします。



■動作環境

【e.Document Sorter/e.Document Sorter モデル設定プログラム】
対応OS Windows 7 Enterprise/Ultimate/Professional/Home Premium/Starter
Windows Vista Ultimate/Enterprise/Business/Home Premium/Home Basic(SP1以降)
Windows XP Professional/Home Edition(SP3以降)
各日本語版に対応

※Microsoft .NET Framework 4.0が別途必要です。
※64bit版Windows XP/Windows Vista、Windows 7のXPモード、Macintoshは動作保証外となります。
64bit版Windows 7では32bit互換モード(WOW64)で動作します。
対応機種 上記OSが正常に動作する機種
動作メモリ 512MB以上(Windows 7/Windows Vistaの場合は1GB以上)
推奨1GB以上(Windows 7/Windows Vistaの場合は2GB以上)

※上記容量に加えて並列化数×140MBのメモリが必要となります。
必要HD容量 約70MB以上(e.Document Sorter)
約80MB以上(e.Document Sorter モデル設定プログラム)
ディスプレイ 1024×768ピクセル以上(24ビットフルカラー以上)
その他 アクティベーションを行うためにインターネット接続環境が必要です。

※インターネットに接続できない場合、インターネットに接続可能な別のパソコンを使って代理認証させることができます。

【文書分類ライブラリ】
対応OS Windows 7 Enterprise/Ultimate/Professional/Home Premium/Starter
Windows Vista Ultimate/Enterprise/Business/Home Premium/Home Basic
Windows XP Professional/Home Edition(SP3以降)
各日本語版に対応

※Microsoft .NET Framework 4.0が別途必要です。
※64bit版Windows XP/Windows Vista、Windows 7のXPモード、Macintoshは動作保証外となります。
64bit版Windows 7では32bit互換モード(WOW64)で動作します。
対応機種 上記OSが正常に動作する機種
開発環境 VC10、Visual Studio C# 2010(対象フレームワークは2.0、4.0)
その他 アクティベーションを行うためにインターネット接続環境が必要です。

※インターネットに接続できない場合、インターネットに接続可能な別のパソコンを使って代理認証させることができます。
※本ライブラリはCLR1.0とCLR2.0のアセンブリがプロセス内に混在するアプリケーションからは使用できません。


■お問い合わせ

◇商品に関するお問い合わせ先

メディアドライブ株式会社 営業部
TEL:03-5720-7210

※ご使用に際してはソフトウェア使用許諾書に準じます。
※本商品は、第三者に対して、賃貸、貸与、販売、ならびに譲渡することはできません。
※Windowsは米国Microsoft社の商標です。
※QRコードは株式会社デンソーウェーブの登録商標です。
※その他の記載された会社名・商品名は各社の商標または登録商標です。
※記載された内容は予告なく変更することがありますので予めご了承ください。
※記載された内容は2011年4月現在のものです。

 
     
高精度のOCR商品ならメディアドライブ
| ホーム | トピックス | 商品情報 | 企業情報 | サポート | お問い合わせ | オンラインショップ |
高精度のOCR商品ならメディアドライブ
| 個人情報保護方針 | 情報セキュリティ基本方針 | サイトポリシー | サイトマップ |
高精度のOCR商品ならメディアドライブ
フッタ