【HALCON】do_ocr_word_mlp 関数について - MLPアルゴリズムを用いた単語認識OCR処理
2024-09-05
2024-09-05
HALCON
のdo_ocr_word_mlp
関数は、MLP(多層パーセプトロン)アルゴリズムを使用して単語全体を認識する光学文字認識(OCR)を行うための関数です。通常のOCRが1文字ずつ認識するのに対し、この関数は単語全体を一度に認識します。MLPアルゴリズムにより、高精度な単語認識が可能となり、製造業のラベル認識や文書処理に広く応用されています。
do_ocr_word_mlp 関数の概要
do_ocr_word_mlp
は、トレーニング済みのMLPモデルを使用して単語領域を指定し、OCRを実行する関数です。MLPはニューラルネットワークの一種で、複雑なパターン認識に優れており、単語全体を一度に認識する場面で特に有効です。この関数は、製造業や文書処理システムでのラベルやパッケージ上の文字認識に適しています。
使用方法
do_ocr_word_mlp
関数の基本的な使用方法は以下の通りです。
do_ocr_word_mlp(OCRHandle, Image, WordRegion, Class, Confidence)
OCRHandle
トレーニング済みのMLP OCRモデルのハンドル。Image
OCRを実行する入力画像。WordRegion
認識対象となる単語領域。Class
認識された単語を返す変数。Confidence
認識結果の信頼度を示す値。
この関数は、指定された単語領域に対してOCRを実行し、認識された単語をClass
に、信頼度をConfidence
に格納します。
具体例
以下に、do_ocr_word_mlp
関数を使用して単語領域に対するOCRを実行する具体例を示します。
* 画像の読み込み
read_image(Image, 'text_image')
* 単語領域の生成
gen_rectangle1(WordRegion, 100, 50, 250, 100)
* MLP OCRモデルの読み込み
read_ocr_class_mlp('Industrial_Word_Model.omc', OCRHandle)
* OCRの実行
do_ocr_word_mlp(OCRHandle, Image, WordRegion, Class, Confidence)
* 結果を表示
disp_message(WindowHandle, Class, 'window', 12, 12, 'black', 'true')
この例では、画像text_image
の指定された領域(WordRegion
)に対してOCRを実行し、その領域内の単語を認識しています。Class
変数に結果が保存され、画面に表示されます。
応用例
do_ocr_word_mlp
は、以下のような場面で使用されます。
-
製品ラベルの単語認識
製品やパッケージに記載された単語を一度に認識し、自動的に情報を管理したり、検査したりする際に利用されます。 -
文書処理の自動化
書類やフォーム内の特定の単語フィールドを自動的に認識し、効率的なデジタルデータの管理や検索が可能になります。 -
在庫管理や物流システム
製品ラベルやパッケージに記載された単語を読み取り、在庫管理や物流追跡に使用します。
注意点
do_ocr_word_mlp
を使用する際は、OCRモデルが認識対象の単語やフォントに適合していることが重要です。認識精度は、トレーニングデータや文字の大きさ、画像解像度に依存するため、適切な設定とテストが推奨されます。また、単語領域を正確に指定することも結果の精度に影響するため、十分な注意が必要です。
まとめ
HALCON
のdo_ocr_word_mlp
関数は、MLPアルゴリズムを使用した単語全体の高精度なOCR処理を実現するためのツールです。製造業や文書処理システムにおいて、単語単位での認識が求められる場面に最適であり、ニューラルネットワークを活用したパターン認識により、高精度な結果を提供します。