【HALCON】import_lexicon関数ガイド - 辞書データのインポート
2024-09-11
2024-09-11
HALCON
のimport_lexicon
関数は、OCR(光学文字認識)やテキスト認識プロセスにおいて使用する辞書データをインポートするための機能です。この関数を使用することで、ユーザーが定義した辞書データをシステムに読み込ませ、文字認識の精度を向上させたり、特定の業界用語やカスタム文字列を効率的に認識させることが可能になります。
import_lexicon関数の概要
import_lexicon
関数は、OCRやテキスト認識の際に利用する辞書データを外部ファイルからインポートします。辞書には、認識させたい特定の単語やフレーズを定義でき、これにより認識結果の信頼性を高めることができます。たとえば、製造業の特定用語や製品コードなど、誤認識を防ぎたい場面で役立ちます。
基本構文
import_lexicon(LexiconFile, OCRHandle)
LexiconFile
辞書ファイルのパス。テキストファイルとして保存されている単語やフレーズのリストです。OCRHandle
OCRシステムのハンドル。インポートした辞書データが適用されるOCRモデル。
この関数は、指定された辞書ファイルをOCRシステムに読み込み、テキスト認識時に辞書を活用します。
使用例
次に、import_lexicon
関数を使って辞書データをインポートし、OCRで使用するシンプルな例を示します。
* OCRモデルの作成
create_text_model_reader('auto', OCRHandle)
* 外部の辞書データをインポート
import_lexicon('custom_lexicon.txt', OCRHandle)
* 画像から文字を認識
read_image(Image, 'example_image')
find_text(OCRHandle, Image, FoundText)
* 結果の表示
disp_message(WindowID, FoundText, 'window', 12, 12, 'black', 'true')
この例では、OCRモデルを作成し、外部の辞書ファイルcustom_lexicon.txt
をインポートしています。その後、画像から文字を認識し、インポートされた辞書を基に結果を表示します。
実際の応用
カスタム辞書によるOCR精度向上
import_lexicon
を使用することで、標準のOCRエンジンに特定の単語や用語を追加できます。たとえば、製造業の製品コードや医療用語など、特定の文字列の認識を強化することで、誤認識を減らし、精度の高い文字認識を実現します。
特定の業界用語の認識
OCRシステムに特定の業界用語やカスタムフレーズを導入し、それらを認識することができます。これにより、標準OCRでは難しい専門用語や略語などを正確に識別することが可能になります。
誤認識の防止
辞書をインポートすることで、特定の文字列に優先的に認識を割り当てることができます。これにより、似た形状の文字の誤認識を防ぎ、特定の単語やフレーズが確実に認識されるようになります。
import_lexiconの応用例
次の例では、製品ラベルのOCRに使用するカスタム辞書をインポートし、製品コードを正確に認識する方法を示します。
* OCRモデルの作成
create_text_model_reader('auto', OCRHandle)
* 製品コード辞書のインポート
import_lexicon('product_codes.txt', OCRHandle)
* 画像から製品コードを認識
read_image(Image, 'product_label_image')
find_text(OCRHandle, Image, FoundText)
* 結果の表示
disp_message(WindowID, FoundText, 'window', 12, 12, 'black', 'true')
この例では、product_codes.txt
という製品コードの辞書をインポートし、製品ラベル画像から正確に製品コードを抽出しています。
まとめ
HALCON
のimport_lexicon
関数は、OCRやテキスト認識における辞書データのインポートを通じて、認識精度を向上させるための強力なツールです。特定の業界用語やカスタム文字列を辞書として導入し、誤認識を防ぎながら高精度の文字認識を実現することが可能です。製造業や医療分野など、専門用語が多く含まれるシーンで特に有効です。