文字を学習する

NI OCR Training

文字を学習する

学習/読み取りタブを使用して、画像を開いて文字を学習し、文字の値を文字セットファイルに保存します。

文字を学習するには、以下の手順に従ってください。

  1. OCR学習インタフェースを開く
  2. ファイル→画像を開くをクリックし、学習で使用する画像を1つあるいは複数選択します。<Ctrl>キーを押しながら各ファイルをクリックすることで、複数の画像ファイルを選択することができます。すべてのファイルを選択チェックボックスを有効にする方法でも、指定したディレクトリのすべての画像を開くことができます。
  3. 開くをクリックします。
  4. 参照ボタンを使用して学習に使用する画像を検索します。
  5. 画像で、学習する文字の周りにROIを描きます。
    ヒント  必要に応じて、画像の表示を変更することができます。

    OCRは、ダイアログボックス下部の各タブのデフォルト設定にしたがって、ROIでオブジェクトを分割し、このオブジェクトをブルーで表示してオブジェクトの周りに文字の外接長方形を描きます。読み取られたテキストは、使用している文字セットファイルに基づいて、認識した文字と代替文字を表示します。文字セットファイルを開いていない場合、読み取られたテキストはROIで分割された各オブジェクトの代替文字を表示します。たとえば、ROIに3つの分割されたオブジェクトが含まれる場合、読み取られたテキストは3つの代替文字を含みます。文字の外接長方形で囲まれたオブジェクトはすべて分割されたオブジェクトです。

    読み取りオプションタブで代替文字を指定します。

  6. 2値化上級2値化、およびサイズと間隔タブを使用して、学習プロセスで使用するパラメータを設定します。OCRを構成して、ROIで適切にオブジェクトの周りに文字の外接長方形を描くには、2値化メソッドと設定を調整して、他のタブで変更を行います。OCRは、分割されたオブジェクトを青で表示します。
  7. すべての文字を学習をクリックします。
  8. 正しい文字列では、ROIで指定した各オブジェクトに関連付けられた文字の値を入力します。入力する文字の値の数は、ROIで検出されるオブジェクトの数に一致する必要があります。
  9. 学習をクリックしてください。
  10. 読み取られたテキストが表示する文字が間違っている場合は、2値化上級2値化、およびサイズと間隔タブでパラメータを調整してください。
  11. 追加の文字を学習するには、手順3から手順10を繰り返してください。
  12. ファイル→文字セットファイルを保存をクリックし、文字セットファイルの名前を入力して、保存をクリックします。
  13. 参照ボタンを使用して、各画像を表示します。読み取られたテキストが、各画像の正しい文字を表示しているかどうか確認します。読み取られたテキストが代替文字や間違っている文字を表示する場合、読み取りオプションタブのパラメータを調整するか、または間違っている文字を学習して、文字セットファイルを保存します。

間違っている文字を学習する

描いたROIがすでに学習した文字を含む場合、間違っている文字を学習します。たとえば、文字A、P、Rを含む画像を解析し、この3つの文字を学習して文字セットファイルに保存する場合、後でこの文字セットファイルを使用して別の画像で文字を学習することができます。2番目の画像に文字A、P、R、Oがある場合、OCRは認識した文字A、P、Rと代替文字を読み取られたテキストに表示します。

また、OCRが分割されたオブジェクトの間違っている文字の値を表示する場合は、間違っている文字を学習します。たとえば、ROIに文字A、P、R、Oがあり、読み取られたテキストにPの代わりに文字Bがある場合は、間違っている文字を学習オプションを使用して文字Pを正しく学習します。

間違っている文字を学習するには、以下の手順に従ってください。

  1. OCR学習インタフェースを開く
  2. ファイル→画像を開くをクリックし、学習で使用する画像を1つあるいは複数選択します。<Ctrl>キーを押しながら各ファイルをクリックすることで、複数の画像ファイルを選択することができます。すべてのファイルを選択チェックボックスを有効にする方法でも、指定したディレクトリのすべての画像を開くことができます。
  3. 開くをクリックします。
  4. 参照ボタンを使用して学習に使用する画像を検索します。
  5. 画像で、学習する文字の周りにROIを描きます。

    OCRは、ダイアログボックス下部の各タブのデフォルト設定にしたがって、ROIでオブジェクトを分割し、このオブジェクトをブルーで表示してオブジェクトの周りに文字の外接長方形を描きます。読み取られたテキストは、使用している文字セットファイルに基づいて、認識した文字と代替文字を表示します。文字セットファイルを開いていない場合、読み取られたテキストはROIで分割された各オブジェクトの代替文字を表示します。たとえば、ROIに3つの分割されたオブジェクトが含まれる場合、読み取られたテキストは3つの代替文字を含みます。文字の外接長方形で囲まれたオブジェクトはすべて分割されたオブジェクトです。

  6. 2値化、上級2値化、サイズと間隔タブを使用して、学習プロセスで使用するパラメータを設定します。OCRを構成して、ROIで適切にオブジェクトの周りに文字の外接長方形を描くには、2値化メソッドと設定を調整して、他のタブで変更を行います。OCRは、オブジェクトを青で表示します。
  7. 間違っている文字を学習をクリックします。
  8. 正しい文字列で適切な文字の値(事前に学習および認識を行った文字を含む)を入力して、学習をクリックします。

    正しい文字列で分割されたすべてのオブジェクトの文字の値を入力する必要がありますが、NI OCRは読み取られたテキストで一致しないオブジェクトまたは正しく一致していないオブジェクトのみを学習します。

単一文字またはパターンを学習する

単一文字またはパターンを学習するには、以下の手順に従ってください。

  1. OCR学習インタフェースを開く
  2. ファイル→画像を開くをクリックし、学習で使用する画像を1つあるいは複数選択します。<Ctrl>キーを押しながら各ファイルをクリックすることで、複数の画像ファイルを選択することができます。すべてのファイルを選択チェックボックスを有効にする方法でも、指定したディレクトリのすべての画像を開くことができます。
  3. 開くをクリックします。
  4. 参照ボタンを使用して学習に使用する画像を検索します。
  5. 画像で、学習する文字の周りにROIを描きます。

    OCRは、ダイアログボックス下部の各タブのデフォルト設定にしたがって、ROIでオブジェクトを分割し、このオブジェクトをブルーで表示してオブジェクトの周りに文字の外接長方形を描きます。読み取られたテキストは、使用している文字セットファイルに基づいて、認識した文字と代替文字を表示します。文字セットファイルを開いていない場合、読み取られたテキストはROIで分割された各オブジェクトの代替文字を表示します。たとえば、ROIに3つの分割されたオブジェクトが含まれる場合、読み取られたテキストは3つの代替文字を含みます。文字の外接長方形で囲まれたオブジェクトはすべて分割されたオブジェクトです。

  6. 2値化、上級2値化、サイズと間隔タブを使用して、学習プロセスで使用するパラメータを設定します。OCRを構成して、ROIで適切にオブジェクトの周りに文字の外接長方形を描くには、2値化メソッドと設定を調整して、他のタブで変更を行います。OCRは、オブジェクトを青で表示します。
  7. 単一文字を学習をクリックします。
  8. 学習する文字の指標を選択します。OCRは、異なる色で対応している文字の外接長方形を表示します。
  9. 正しい文字列に適切な文字を入力してください。
  10. 学習をクリックしてください。