スマートOCR オンラインマニュアル

スマートOCR オンラインマニュアル

メニュー
メニューを閉じる

やりたいことから探す

CSVでデータ出力したい

OCR処理後の抽出データをCSV形式でデータ出力する方法はいくつかあります。ここではそれぞれの出力方法について説明したします。

W4-1.CSV出力の種類

W4-1-1スマートOCRではOCR処理後のCSVデータ出力の方法は3種類あります。

CSV出力の画面 特徴
確定データ一覧 項目別の抽出データ。複数のファイルをまとめてデータ出力することができます。ダウンロード有無のステータス管理も可能です。
OCR変換>データ抽出 項目別の抽出データ。1ファイルごとにデータ出力します。
OCR変換>スプレッドシート OCR変換したすべてのテキストを出力します。1ファイルごとの出力となります。

CSVファイルのフォーマットは上記の出力方式によってどれも異なります。

W4-2.「確定データ一覧」のCSV出力

W4-2-1確定データ一覧の画面ではデータを複数ファイルのデータを一覧化し、まとめてダウンロードすることが可能です。

「確定データ一覧」のCSV出力

注意

確定データ一覧の画面へ表示されるのは、OCR変換>データ抽出の画面で、保存・確定が完了したファイルが対象となります。

W4-2-2確定データ一覧のCSV出力では、キーバリューデータの出力のみならず、キーバリューデータと明細データ(表データ)を結合して出力することも可能です。

確定データ一覧のCSV出力では、キーバリューデータの出力のみならず、キーバリューデータと明細データ(表データ)を結合して出力することも可能です。

W4-2-3デフォルトファイル名指定

出力するCSVファイルのデフォルト名称ルールを設定します。設定後は、次回からのCSV出力では同じ名称ルールが適用されます。

デフォルトファイル名指定

デフォルトファイル名は以下の命名パターンから選択可能です。

デフォルトファイル名指定ポップアップ画面

W4-2-4項目指定

出力するCSVファイルの項目の指定や並び順を設定します。設定後は、次回からのCSV出力では同じ選択項目ルールが適用されます。

項目指定

チェックの入っている項目が出力対象となります。アイコンをマウスでドラッグすることで項目の並び順を変更することができます。

W4-2-5文字コード/区切文字

出力するCSVファイルの文字コードや区切り文字を設定します。設定後は、次回からのCSV出力では同じ文字コード・区切り文字のルールが適用されます。

文字コード/区切文字

文字コードはSHIFT-JS・UTF-16・UTF-8のいずれか、区切り文字はカンマ・タブのいずれかを選択できます。

W4-2-6対象データ

出力するCSVファイルの対象データを設定します。設定後は、次回からのCSV出力では同じ対象データのルールが適用されます。

対象データ

「選択した対象データ」を選んだ場合、チェックボックスにチェックを入れたデータのみがダウンロードされます。 「検索結果に該当する全データ」を選んだ場合、チェックボックスのチェックに関係なく検索結果のすべてのデータがダウンロードされます。 複数ページにわたるほどに検索結果のデータ量が多い場合においては、すべてのデータにチェックを入れる作業が手間になるため、大量データを一括で全件ダウンロードしたい場合には「検索結果に該当する全データ」を選択すると便利です。

確定データ一覧の検索についてはこちらで解説しております。出力するデータの範囲を操作したい場合は、検索方法の解説をご覧ください。

注意

上記の各種CSV出力の設定においては、一度選択したら次回以降も同じ設定が保持されます。 (テンプレート単位で保持します。)

W4-3.「OCR変換>データ抽出」の画面からCSV出力

W4-3-1「OCR変換>データ抽出」の画面では、現在表示されているファイルの抽出結果をCSVデータで出力することが可能です。

「OCR変換>データ抽出」の画面からCSV出力

W4-3-2データ抽出の画面におけるCSV出力では、キーバリューデータと明細データ(表データ)は別々のCSVデータとして出力されます。

W4-3-3デフォルトファイル名指定

出力するCSVファイルのデフォルト名称ルールを設定します。設定後は、次回からのCSV出力では同じ名称ルールが適用されます。

デフォルトファイル名指定

デフォルトファイル名は以下の命名パターンから選択可能です。

出力するCSVファイルのデフォルト名称ルールを設定します

W4-3-4項目指定

出力するCSVファイルの項目の並び順を設定します。設定後は、次回からのCSV出力では同じ名称ルールが適用されます。

項目指定

チェックの入っている項目が出力対象となります。アイコンをマウスでドラッグすることで項目の並び順を変更することができます。

出力するCSVファイルの項目の並び順を設定します。

W4-3-5文字コード/区切文字

出力するCSVファイルの文字コードや区切り文字を設定します。

文字コード/区切文字

文字コードはSHIFT-JS・UTF-16・UTF-8のいずれか、区切り文字はカンマ・タブのいずれかを選択できます。

出力するCSVファイルの文字コードや区切り文字を設定します。

W4-3-6キーバリューデータの出力

キーバリューデータのCSVレイアウトにおいて、縦並び・横並びを選択可能です。

キーバリューデータの出力

縦並び・横並びのいずれかを選択します。

キーバリューデータのCSVレイアウトにおいて、縦並び・横並びを選択可能です。

注意

上記の各種CSV出力の設定においては、一度選択したら次回以降も同じ設定が保持されます。 (ユーザーID単位で保持します。)

W4-4.「OCR変換>スプレッドシート」の画面からCSV出力

W4-4-1「OCR変換>スプレッドシート」の画面では、現在表示されているファイルのOCR処理した全テキストをCSVデータとして出力することが可能です。データ抽出設定されていなくとも全テキストを出力できることが特徴です。

「OCR変換>スプレッドシート」の画面からCSV出力

注意

スプレッドシートでは罫線を忠実に再現してセルに配置しているわけではありません。OCR処理後にEXCELデータとして変換することを目的としている機能ではなく、OCR処理した全テキストを効率よく取り出しやすくすることを目的とした機能です。

W4-4-2文字コード/区切文字

出力するCSVファイルの文字コードや区切り文字を設定します。

文字コード/区切文字

文字コードはSHIFT-JS・UTF-16・UTF-8のいずれか、区切り文字はカンマ・タブのいずれかを選択できます。次回からのCSV出力では同じ文字コード・区切り文字のルールが適用されます。

出力するCSVファイルの文字コードや区切り文字を設定します。