帳票認識ライブラリ v.10.0

帳票画像から、あらかじめ指定したテンプレートに従い帳票内の文字情報を抽出、テキストデータに変換するOCRライブラリ
帳票認識ライブラリ

帳票認識ライブラリ v.10.0は、スキャナなどから取り込んだ帳票画像から、あらかじめ指定したテンプレートに従い帳票内の文字情報を抽出、テキストデータに変換するOCRライブラリです。
本ライブラリをお客様の既存システムやソフトウェアに組み込むことによって、シームレスに手書き文字や活字文字に対するOCR機能を容易に追加することができます。

帳票ライブラリ活用

 

OCRエンジンの使い分けにより低コストで運用が可能

帳票認識ライブラリは、従来方式のOCRエンジンやAI-OCRエンジン、また帳票認識ライブラリ v.10.0から新連携したクラウド型のOCRで構成されています。帳票や認識項目に応じた導入が可能なため、低コストに運用が可能です。従来OCRとAI-OCRはオンプレミスでのOCR運用(非クラウド)が可能です。

ハイブリッドOCR

 

OCR
 
オンプレミス型OCR

 

従来OCRで認識できない文字はAI-OCRでフォロー

高精度で安定しやすい文字枠内の手書き文字や活字文字、バーコード・QRコードは従来のOCRで認識。フリー枠内の手書き文字など従来は認識しづらかった文字はAI-OCRなど使い分けが可能です。

AI-OCRと従来OCRの組み合わせ

※AI-OCRは氏名・氏名フリガナ/ふりがな・郵便番号・住所・電話・FAX・数字・金額・日付項目に対応しています

 

AI-OCRは年額制で使い放題。追加料金を心配する必要がありません

AI-OCRは枚数を気にせず使える年額制。毎年決まった金額のみ・追加料金なしの安心プランです。
項目単位やページ単位での課金がないので処理枚数を心配する必要がありません。

AIOCRは定額制

数字の認識精度向上NEW

帳票認識ライブラリ v.10.0からはAI-OCRの数字認識の精度が全般的に向上。さらに、罫線や文字同士で接触している数字の認識精度を向上させ、数字以外の記号や点線は無視して認識することにより、データ入力を効率化させます。

接触文字の認識精度向上
接触文字の認識精度向上
 

「文字」と「罫線」が接触した文字、また文字同士が接触した際の認識精度が向上しました。

数字「以外」の認識除外
数字以外の認識除外
 

数字専用設定にて、数字以外の記号等を認識結果から除外します。電話番号のハイフン・カッコを除外し数字だけ出力する場合などに利用します

クラウド型OCR連携NEW

帳票認識ライブラリ v.10.0から「Google Cloud のCloud Vision API」と新連携しました。一般名称欄や備考欄など認識項目を限定せずに対応が可能で、全般的に認識精度が向上します。
※「Google Cloud のCloud Vision API」は定額制ではありません

クラウド

 

特長
 
認識関連機能

認識や学習機能でより活用が可能になります。

既存の帳票やExcel作成の帳票がご利用可能
黒枠で印刷された既存帳票、ドロップアウトカラー帳票、カラー帳票など帳票用紙には柔軟に対応。OCR用に新たな帳票作成をする必要がなく、短期間での導入を実現します。
またExcelやWord等を利用して作成した帳票もご利用いただけます。
Excel/Word作成帳票
Excel/Word作成帳票
 

ExcelやWordを利用して簡単に帳票作成。
専用帳票と異なり、レイアウトや内容の変更も容易。

ドロップアウトカラー帳票
ドロップアウトカラー帳票
 

ドロップアウトカラーで印刷された帳票も利用可能。
※色指定2値化オプションが必要な場合あり

カラー帳票
カラー帳票
 

入学願書や履歴書などのカラー写真、車検証や証券など地紋入り帳票の読み取りが可能です。

混在用紙の認識

用紙サイズや色数(白黒/カラー)、向きが混在していてもまとめて認識可能です。
※色数などに制限があります

混在用紙の認識

学習機能

活字・印字文字の特殊書体(フォント)や手書きのくせ字など、文字を登録学習させることで認識精度が向上します。※従来OCRのみ対象

学習機能

知識処理機能

姓名辞書・郵便番号辞書(住所辞書)との照合を行うことで認識精度が向上。ユーザー特有の単語辞書やコード辞書の作成も可能。※従来OCRのみ対象

 

知識処理機能

設定関連機能
桁単位での文字種指定

フィールド項目単位だけでなく、桁単位の文字種指定が可能です。

桁単位の文字種指定

確認・訂正
データチェック機能で人的ミス防止
認識結果(手動の訂正結果含む)に対して論理チェックを行い範囲外であればエラー表示するデータチェック機能をご用意。金額欄の合計チェック、日付・時間の正規表現、必須項目の記入チェックなどの論理チェック(範囲・四則演算・マスターチェックなど)が可能です。
チェック例
 
文字数
文字数チェック
日付表現
日付表現
指定文字
指定文字
必須項目
必須

 

 

活用
 
導入事例
TIS株式会社 様
財務諸表入力システム
 
財務諸表入力システム
TIS株式会社様では、決算書の自動入力を可能とする「財務諸表入力システム」を提供しています。そのシステムに当社「帳票認識ライブラリ」が採用されています。
「財務諸表入力システム」は、スキャナーで財務諸表を読み込み画像処理(OCR)した後、勘定科目辞書との引き当てと金額チェックを行い、統一された勘定科目体系に集約されたデータをDBに蓄積します。
株式会社neix 様
FAX誤送信防止システム
 
FAX入試誤送信防止システム
株式会社neix様では、コールセンターソリューション・通信インフラ製品のひとつとして「FAX誤送信防止システム」を提供し、そちらのシステムに「帳票認識ライブラリ」が採用されています。FAXサーバにFAX番号や電話番号を登録しておき、送信時に送信状を読み取って照合する「OCRタイプ」と、送信時に有人承認者に送信依頼が送られ承認者の許可が出たものだけが送信される「承認タイプ」の2種類を用意。FAXの誤送信による情報漏えい防止対策が構築できます。

 

 

仕様
 
動作環境
対応OS 【こちら】をご覧ください
開発環境 Microsoft Visual C++ 2015以降
Microsoft Visual C# /2015以降
CPU Intel Core i5 第10世代以上
動作メモリ 8GB以上(AI-OCRオプション使用時16GB以上)
その他 アクティベーションを行うためにインターネット接続環境が必要です。インターネットに接続できない場合、インターネットに接続可能な別のパソコンを使って代理認証させることができます。
制限事項 ・本ライブラリは同一プロセス内での非同期実行には対応していません (マルチスレッド呼び出し非対応) 。また別プロセスからの呼び出しであっても、本ライブラリのインストールフォルダが同じ場所の場合は非同期実行には対応しておりません。
・製品に同梱される「帳票設定ツール」、または別売りの「FormOCR」で作成した帳票定義ファイルが必要となります。
・以下の環境では動作保証していません。
1.1つのPC環境で複数人が同時接続する場合
2.商品に同梱される帳票設定ツールは、FormOCR、WinReader Hand S、WinReader p.Formと同じパソコン内では使用できません。

 

 

仕様
認識文字種(手書き)
文字属性 文字数 字種・字体 備考
漢字 3421 JEIDA-44-1988 JIS第1水準 全文字種
記号(仝々)2種
JIS第2水準 454種
※句点(、)・読点(。)は個別設定で登録してください。
ひらがな 82 OCR-HH(JIS X9009-1985)の81種
長音記号(ー)
あいうえおかがきぎくぐけげこごさざしじすずせぜそぞただちぢつづてでとどなにぬねのはばぱひびぴふぶぷへべぺほぼぽまみむめもやゆよらりるれろわをんぁぃぅぇぉっゃゅょゎー
※句点(、)・読点(。)は個別設定で登録してください。
カタカナ 85 OCR-HK(JIS X9005-1979)の47種
濁音、半濁音文字26種
小文字 12種
アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンーガギグゲゴザジズゼゾダヂヅデドバビブベボパピプペポヴァィゥェォヵヶッャュョヮ
※濁点(゛)・半濁点(゜)は単独文字として認識対象に含まれません。
英字 52 OCR-HA(JIS X9007-1981)
大文字26種、小文字26種
a-z
A-Z
小文字の基準字体はブロック体
数字 11 OCR-HN(JIS X9006-1979) 0123456789-マイナス記号(-)OCR-HS (JIS X9008-1981)を含む
記号 23 OCR-HS(JIS X9008-1981)の23種 $!\=+-*/()&@#.,%<>:?"[]

 

AI-OCR認識文字種
AI-OCR 認識対象文字
AI 一文字手書き認識 数字・記号・カタカナ・ひらがな・英字(小・大文字)・漢字(JIS 第1 水準、第2 水準454 種)
AI 自由手書き認識 郵便番号 数字 〒 -(ハイフン)
住所 漢字 ひらがな カタカナ 数字 記号 英字
姓名 漢字 ひらがな カタカナ 英字 ヶ 々 〆 仝 .
姓名(フリガナ) カタカナ ※ひらがなは非対応。
金額 数字 ,(カンマ)-(ハイフン)¥ 円
日付 数字 / 令和 平成 昭和 大正 明治 年 月 日 元 .R H S T M

 

認識文字種(OCR-B/OCR-K)
文字属性 文字数 字種・字体 備考
数字 11 OCR-B
(JIS X9001-1976)
マイナス記号(-)を含む
英大文字 26 OCR-B
(JIS X9001-1976)
 
記号 23 OCR-B
(JIS X9001-1976)
,.:?!/”()[]+-=<>¥$%#&*@
カタカナ 49 OCR-K(JIS X9003-1980)の大文字46種
及び記号3種
記号は濁点(゛)、半濁点(゜)、長音記号(ー)

※文字サイズは14~28ポイント

 

認識文字種(活字)
文字属性 文字数 字種・字体 備考
漢字 6355 明朝体、ゴシック体、教科書体等マルチフォント対応 JIS第1水準 全文字(2965種)
JIS第2水準 全文字(3390種)
ひらがな 83 ぁあぃいぅうぇえぉおかがきぎくぐけげこごさざしじすずせぜそぞただちぢっつづてでとどなにぬねのはばぱひびぴふぶぷへべぺほぼぽまみむめもゃやゅゆょよらりるれろゎわゐゑをん
かたかな 86 ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレロヮワヰヱヲンヴヵヶ
英字 52 ABCDEFGHIJKLMNOPQRSTUVWXYZ
abcdefghijklmnopqrstuvwxyz
数字 10 0123456789
記号 107 、。,.・:;?!゛゜´`¨^ ̄_ヽヾゝゞ〃仝々〆〇――‐/\~∥|…‥‘’“”()〔〕[]{}〈〉《》「」『』【】+-±×÷=≠<>≦≧∞∴♂♀°′″℃¥$¢£%#&*@§☆★○●◎◇◆□■△▲▽▼※〒→←↑↓〓
記号
ギリシャ文字
23 ΣΦΨΩ
αβγδεζηθκλμξπρστφψω
記号
NEC機種依存文字
68 ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ
㍻㍾㍽㍼№㏍℡
①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳
㍉㌔㌢㍍㌘㌧㌃㌶㍑㍗㌍㌦㌣㌫㍊㌻
㎜㎝㎞㎎㎏㏄㎡
㊤㊥㊦㊧㊨㈱㈲㈹
・文字サイズは3~15mm角程度
<推奨文字サイズ>
200dpi:5~7mm、14~20ポイント
300dpi:3.5~5mm、10~14ポイント
400dpi:3~4mm、9~11ポイント

【規格について】
規格に関しては、JISX 0208が元になっています。但し、第1区の記号の一部『ヽヾゝゞ』などや、第6区のギリシア文字の一部、第7区のキリル文字、第8区の記号が認識対象になっていないため、JISX0208のサブセットとして扱います。
※記号…NEC機種依存文字のローマ数字、㍻㍾㍽㍼№㏍℡は個別設定の登録が必要です。
※認識文字種について詳細はお問い合わせください。

 

 
認識文字種(バーコード・QRコード)カメラ画像の読み取り
バーコード JAN8、JAN13、ITF、CODE39、CODE128、NW-7、カスタマバーコード(日本郵便)
QRコード モデル2(バージョン 1~40)
※ベアラバーありのバーコードには非対応 ※検出可能なバーコードまたはQRコードは、1フィールドにつき1コード

 

入力
画像解像度 200/300/400/600dpi
用紙サイズ スキャナ:最大A3サイズ
カメラ:最大A4サイズ
カメラ画像 500~3500万画素
画像形式 モノクロ2値/8,24bitカラーのシングルTIFF(圧縮、非圧縮)、BMP

 

構成
標準パターンファイル読み込み (OcrPatternLoad)
類似文字ファイル読み込み (OcrSimilarLoad
文字認識 (OcrFormRecogStart)
認識結果メモリの解放 (OcrFormStructFree)
認識クローズ (OcrFormRecogEnd)

※知識処理は帳票定義ファイルに記述された情報をもとにOcrFormRecogStart()関数で実行されます。 知識処理を実行するには各種の辞書ファイルが必要です。また、本ライブラリの呼び出し実行可能 ファイル存在ディレクトリに「aibox.ini」を作成し、[aibox]セクションの「dicdir」キーに辞書ファイル(dicディレクトリ)格納場所のフルパスを設定する必要があります。

 

制御方法

本商品を使用するアプリケーションプログラムは、以下の手順で文字認識を行ないます。
1. 標準パターンファイル読み込み(OcrPatternLoad)
  類似文字ファイル読み込み(OcrSimilarLoad)
2. 認識処理
  イメージのファイル化(BMP、TIFF)
  (1) 認識処理(OcrFormRecogStart)
    ・帳票のマッチング
    ・フィールドの切り出し
    ・文字の切り出し
    ・知識処理
    ・認識結果のファイル出力
  (2) 認識結果のメモリ解放(OcrFormStructFree)
3. 認識終了(OcrFormRecogEnd)

 

 

ラインナップ
 
基本ライセンス
開発ソフトウェアや構築システムに応じて柔軟なライセンス体系でご対応。
※価格詳細はお問い合わせください
帳票認識ライブラリ v.10.0 開発キット 1,500,000円(税抜)
帳票認識ライブラリ v.10.0 年間保守サービス 225,000円(税抜)
+
オプション機能
※価格はお問い合わせください
● AI-OCR年間利用料
● 外部サービス連携オプション(GCオプション)
● 色指定2値化オプション
● カラー分離オプション
● 色指定2値化オプション 年間保守サービス    
● カラー分離オプション 年間保守サービス    

 

 

お問い合わせ
 
お問い合わせ・ご相談
お問い合わせ

 

CONTACT
お問い合わせ
製品・サービスについてお気軽にお問い合わせください