メディアドライブは高度な文字認識技術、音声/画像認識技術、人工知能(AI)技術をベースに、様々なソリューションをご提供します。



HOME > 商品情報 > OCR Multi Entry Stage > OCR Multi Entry Stage

    OCR Multi Entry Stage


    OCR Multi Entry Stage




    OCR Multi Entry Stage サービス内容


    「OCR Multi Entry Stage」は、「Cloud OCR API」でOCRした結果を修正するためのシステムです。

    「Cloud OCR API」はメディアドライブが提供するクラウド型OCRプラットフォームサービスの総称であり、AI技術とOCR技術によって画像をテキスト化するサービスです。従来のOCRエンジン(手書き・活字の文書/免許証/保険証/名刺/領収書)とAI(深層学習)を使ったハイブリット型です。

    「Cloud OCR API」のOCR結果を一元管理するためのシステムが「OCR Multi Entry Stage」です。
    複数オペレータに担当振り分けしたり進捗状況をリアルタイムで確認することができます。
    使う人を最優先に考えた、直観的でわかりやすいUIとなっています。

    OCR Multi Entry Stage 概要図


    OCR Multi Entry Stage  1:多彩なデータ入力画面


    使う人を最優先に考えた操作性の高いUIを搭載しています。
    各オペレータそれぞれで使いやすい修正画面の選択利用が可能です。
    また、管理者の権限設定により、表示フィールドを限定するなど、セキュリティ対策も考慮されています。

    原本イメージと修正画面の並列表示


    原本イメージと修正画面を並べて表示しています。
    元原本イメージと見比べながら、修正することができます。
    修正箇所の位置が直観的にわかるので、修正箇所がバラバラで複数存在している場合などにおすすめです。


    並列表示


    オーバーレイ表示


    スキャン画像上に、認識結果をオーバレイで表示します。
    認識結果が元の文字のすぐ近くに表示されるので確認しやすくなります。
    スキャン画像に表示されている認識結果を直接、修正することも可能です。


    オーバーレイ表示


    フィールド切り出し表示


    帳票から切り出したフィールドイメージ単位で表示します。
    必要箇所のみ表示させる設定ができるので、慎重に扱う必要がある個人情報等の修正も安心です。


    フィールド切り出し表示


    OCR Multi Entry Stage 特長2:集中管理・複数拠点対応


    管理者による一元管理で複数人・複数拠点での修正が可能です。
    項目ごとで修正担当を分け、担当外の項目は非表示にしておけば情報漏洩リスクも低くなります。
    管理者は全データの修正状況(未訂正/訂正中/一時訂正/訂正完了)がリスト一覧でわかり、オプションツール(DataNature)を使えば、修正状況や担当者ごとの進捗状況をグラフ化して表示することも可能です。

    集中管理・複数拠点対応

    OCR Multi Entry Stage 特長3:複数ディスプレイ対応


    各種操作ウインドウを2画面に振り分けて表示することが可能です。
    帳票の画像イメージ・認識結果の修正画面をそれぞれ別ディスプレイで大きく表示し、修正しやすくします。
    また、画像イメージや修正画面などのウインドウは、すべて、表示/非表示の切り替えが可能です。

    複数ディスプレイ対応

    基本機能


    入力情報抽出 入力情報出力 メモ機能 メモ機能
    訂正完了データや破棄データを抽出・出力。進捗管理やデータ活用に使用できます。 他の人に修正依頼する場合や確認が必要な箇所がどはメモ欄に入力。情報共有することができます。
    学習機能 学習修正 フィールドチェック エラー表示
    過去に修正したデータを自動学習。次回に同じ誤りがあれば自動で置換します。 桁数や文字種を指定しておき、該当しない結果の場合には赤字で表示します。チェック見逃しを減らせます。
    AI OCR AI OCR マスタデータ エラー表示
    AI(深層学習)を応用した最新認識エンジンを使用。データ入力工数の削減が可能です。 マスタデータを作成可能。製品番号と製品名の組み合わせを登録しておけば未入力項目の確認も簡単です。


    OCR Multi Entry Stage 仕様


    サービス共通仕様


    読み取り言語 日本語
    データベース PostgreSQL
    最大処理量(DB登録件数) 50万件
    同時クライアントアクセス数 50クライアント
    ※ご相談ください
    遠隔地対応 データベースへの接続が可能であるネットワーク環境

    入力


    画像サイズ 最大A3サイズ
    画像形式 白黒2値・グレースケール・カラー
    ※1bit/8bit/24bitに対応(32bit画像には非対応)
    ファイル形式 BMP・JPEG・PDF(1.3以降)
    TIFF(非圧縮・G3・G4圧縮・LZW圧縮/マルチ・シングル)
    ※TIFFの1bitパレット画像には非対応
    ※TIFFのJPEG圧縮は非対応
    画像解像度 スキャナ画像:200~600dpi
    カメラ画像 500 万画素~2300万画素
    ※帳票OCRおよび活字文書OCRはカメラ画像非対応
    ※画像ファイルは1ファイルあたりで5MB以下であること

    出力


    出力形式 CSV形式・TEXT形式(Shift-JIS)・XML形式
    画像出力 Bitmap、TIFF、JPEG、PDF
    ※帳票全体、指定領域(フィールド)
    フィールド出力形式 空白削除・0詰・固定長バイト指定が可能
    後処理 テキスト出力後にBATファイルを実行可能。
    ※テキスト出力前にもBATファイルの実行が可能。
    自動出力 自動出力処理が可能

OCR Multi Entry Stage 動作環境


サーバ


OS Windows Server 2008 R2 / 2012 / 2012 R2 / 2016
メモリ 3GB以上
※推奨8GB以上


クライアント


OS Windows 7/8.1/10
メモリ 2GB以上
※推奨8GB以上