OCRソフトウェアメーカー「メディアドライブ株式会社」は、認識精度の高い活字文書OCRや手書帳票OCR商品をご提供いたします。



HOME > 商品情報 > 帳票OCRソフト FormOCR v.7.0 > FormOCR v.7.0:システム構築例 データ加工オプション

システム構築例 データ加工オプション

FormOCRで出力したCSVファイルを要望どおりの形式にデータ加工するオプションです。
不必要な行・列の削除、行・列の追加、スペースの削除などのデータ加工、またいくつかのCSVファイルを結合するデータ統合処理がプログラムレスで定型処理できます。

DataNatureとFormOCRのコラボ


データ加工例

空白行が入ったデータを削除したり、指定桁以上を削除する、また、項目名をつけるなど、見やすいCSVを出力します。
データ加工例

データ加工(クレンジング・加工)

データを整形したり新たな項目を追加するなどの処理が簡単な設定だけでおこなえます。

■ データ・クレンジング
 ● 無効データの排除
   空白や特定の文字列が入っているレコードを削除
 ● トリミング
   スペース(空白文字)の削除
 ● 表記統一
   ひらがな/カタカナ、大文字/小文字、全角/半角の統一
 ● 日付書式の変換
   日付文字列の書式統一
 ● データ置換
   文字列の置換(変換テーブルの作成、インポートが可能)
 ● コード変換
   文字コード変換、改行コードの最適化

■ データ加工
 ● 項目間の計算
   四則演算、IF関数、日付計算、時間計算
 ● 引用
   1つの項目から桁数、区切文字を指定し必要な部分を引用
 ● 項目結合
   2つの項目を合わせ、1つの項目に結合
 ● ランクの設定
   数値にランクを設け、ランク毎の名称を付加
 ● 補助項目列の追加
   特定の文字列やシステム日付等を全レコードに付加
 ● 期間項目の設定
   年度、上期/下期、四半期、年月日、日、週、曜日、締日


データ加工(分割・集計・結合)

ファイルの分割、集計、結合がおこなえます。

■ ファイル加工
 ● ファイル分割
  分割処理対象項目に設定した項目をユニークなデータごとに分割してファイルを出力します。
  分割処理対象は複数の項目を指定できます。
  また出力ファイル名は、連番形式と参照形式のいずれでも作成可能です。
 ● レコード集計
  処理対象の文字項目と数値項目を選択することにより、レコード集計したファイルを出力します。
  集計対象の項目は文字項目と数字項目それぞれ最大64項目まで対応可能です。
  集計後のレコード件数(集計件数)をカウントし、 別項目 (件数)としてファイルへ出力可能です。

■ データ加工
 ● 結合(マッチング)処理
  マッチングした2ファイルを結合して出力します。
 ● 連結(アベンド)処理
  同じ種類のデータを結合します。
 ● データ統合
  項目数や項目の並びが異なる2つのデータを連結する機能です。
  データ項目内容が⼀致する列を関連付けて連結することができます。



仕様

対応OS Windows Server 2016
Windows Server 2012 R2/2012
Windows Server 2008 R2(SP1以上)/2008(SP2以上)
Windows 10(※1)
Windows 8.1(※2)/Windows8(※2)
Windows 7(SP1以上)
※1 条件の作成・編集には、管理者権限で起動する必要があります。
※2 タッチパネルでの操作には非対応です。
メモリ 推奨4GB以上(最低2GB以上)
HDD容量 1GB以上の空き容量(インストール時)
解像度 1,024×768ドット以上
その他 Microsoft .NET Framework 4.5(SP1以上)が必要です。


関連ソフトのご案内

DataNature
データ分析を直感的に実現させるBIツール