ページ 11

文字認識システムを作りたい

Posted: 2013年5月07日(火) 17:18
by telepas7
(目標)
マウスで手描きした数字を正規化・2値化し、お手本となる数字が書かれたファイルと比較する。
その結果もっともお手本に近いものを出力するといったシステムを作りたいです。

(質問)
目標を定めたのはいいのですが何をどうすればいいのかがほとんど見当がつきません。
書籍やネットで情報収集してみたものの難解な数式や理屈が羅列されているだけで明確な手順?(道標のような)が見えてきません。
やりたいことはわかるのですがパターン認識(文字認識)というテーマが壮大すぎて何から手を付ければいいのか、手を付けても無駄足になるのではないか
等の心配が絶えずなかなか前進できません。
今は2値化等の画像処理に強いOpenCVの環境設定をし、手描きのツールにペイントを使ってもいいのか悩んでいるといった状況です。
技術的な質問ではないのですが、こういった状況をどのようにして打開すればいいのか教えてください。

Re: 文字認識システムを作りたい

Posted: 2013年5月07日(火) 17:42
by usao
目標がどの程度を想定されているのか,によって,まったく答えが変わってくると思います.
どのくらい本格的な(?)ものをめざすのか,というか.
そのあたりのことを少し明確化されると答えやすいかもしれません.

・処理の本格的具合(なんか思いつくのをやってみる←→論文レベルのアルゴリズム)
・処理対象の範囲:サポートする「お手本」からの手書き文字の隔離具合,とでもいうか.
 (「手書き文字」という言葉からは,いろんな形の崩れ方,位置の偏り方等々が想像されるので…)

#”正規化”とは画像サイズのことでしょうか.だとすれば,
 ・ある枠内(正規化サイズ)に,手書き数字が位置する場所と大まかな大きさ
 ・手書き数字の線の太さ
 等がある程度定まっている」という状況を想定しているのでしょうか?

Re: 文字認識システムを作りたい

Posted: 2013年5月07日(火) 17:49
by softya(ソフト屋)
そもそもパターン認識は学術研究レベルですから難しいのは当然といえるかもしれません。
それに決定打がないので、いろんな手法が乱立している思います。
つまり、どれを選んでも大差ない=失敗する確率は同程度だと言うことだと思います。
それと特許も多いはずですので迂闊なことをするとすぐ特許に引っかかります。

数字だけの簡単なのなら、どっかの卒業研究のPDFで見たこと有るような。
・・・・ さがせんかった。

「画像処理とパターン認識入門: 基礎からVC#/VC++.NETによるプロジェクト作成まで」
http://www.morikita.co.jp/books/book/2196
こんな本もあるので良かったら参考にしてください。