【HALCON】do_ocr_word_knn 関数について - KNNアルゴリズムを用いた単語認識OCR処理
2024-09-05
2024-09-05
HALCON
のdo_ocr_word_knn
関数は、KNN(k近傍法)アルゴリズムを使用して単語全体を対象とした光学文字認識(OCR)を行うための関数です。通常のOCRが1文字ずつ認識するのに対して、この関数は複数の文字からなる単語全体を認識し、結果を文字列として返します。KNNアルゴリズムにより、文字のパターンを比較して分類するため、単語の認識において高い精度を提供します。
do_ocr_word_knn 関数の概要
do_ocr_word_knn
関数は、トレーニングされたKNN OCRモデルを使用して、指定された単語領域全体に対してOCR処理を行います。単語全体を一度に認識するため、単語単位での文字認識が求められる場面に適しています。この関数は、製造業や文書処理において、ラベルやパッケージ上の単語認識に広く応用されています。
使用方法
do_ocr_word_knn
関数の基本的な使用方法は以下の通りです。
do_ocr_word_knn(OCRHandle, Image, WordRegion, Class, Confidence)
OCRHandle
トレーニング済みのKNN OCRモデルのハンドル。Image
OCRを実行する入力画像。WordRegion
単語認識を行う領域。Class
認識された単語を返す変数。Confidence
認識結果の信頼度を示す値。
この関数は、指定された単語領域に対してOCRを実行し、認識された単語をClass
に、信頼度をConfidence
に格納します。
具体例
以下に、do_ocr_word_knn
関数を使用して単語領域に対するOCRを実行する具体例を示します。
* 画像の読み込み
read_image(Image, 'text_image')
* 単語領域の生成
gen_rectangle1(WordRegion, 100, 50, 250, 100)
* KNN OCRモデルの読み込み
read_ocr_class_knn('Industrial_Word_Model.omc', OCRHandle)
* OCRの実行
do_ocr_word_knn(OCRHandle, Image, WordRegion, Class, Confidence)
* 結果を表示
disp_message(WindowHandle, Class, 'window', 12, 12, 'black', 'true')
この例では、画像text_image
内の指定された領域(WordRegion
)に対して単語認識を行っています。do_ocr_word_knn
関数を使用して、その領域内の単語を認識し、結果をClass
変数に格納し、画面に表示しています。
応用例
do_ocr_word_knn
は、以下のようなシナリオで活用されます。
-
ラベルやパッケージの単語認識
製品やパッケージに印刷された単語を一度に認識し、内容を自動的に検査したり、データベースに保存したりする場面で使用されます。 -
文書処理の自動化
書類やフォーム内の特定の単語フィールドを自動的に認識し、デジタルデータとして処理することで、文書管理の効率を向上させます。 -
物流や在庫管理
ラベル上の単語情報を読み取り、商品の追跡や在庫管理に応用されます。
注意点
do_ocr_word_knn
を使用する際には、OCRモデルが対象の単語やフォントに適合していることが重要です。認識精度は、モデルのトレーニングデータや対象の文字サイズ、画像の解像度に依存するため、事前に適切な設定とテストを行うことが推奨されます。また、単語領域の正確な指定も結果の精度に影響を与えるため、注意が必要です。
まとめ
HALCON
のdo_ocr_word_knn
関数は、KNNアルゴリズムを用いた高精度な単語認識を行うOCRツールです。製造業や文書処理システムでのラベルやパッケージの単語認識など、単語全体を認識するタスクにおいて非常に有用です。KNNの優れた分類能力を活かし、正確かつ効率的な単語認識を実現します。