OCRの作り方について
Posted: 2012年10月07日(日) 19:05
画像中の文字を検出し、テキストに書き込むソフトを作りたいです。
使用している言語はPHPですが、C言語もできるのでCの回答でもかまいません。
現在、GDライブラリを用いて画像の各座標のRGBを取得するところまでは完成しました。
そこから文字の色のついた部分を1とし、背景を0にしてあらかじめデータベースに保管してある
a-zA-Z0-9までの文字データと比較して文字を判別させようと思っているのですが、他の方法はありますでしょうか?
また、比較方法はどのようにしたらいいでしょうか?
完全一致だと同じフォント、同じサイズ、同じ座標に文字がないと不一致になるかと思います。
似ている文字(たとえば、数字の0とアルファベットのO)など誤字が発生するのは仕方ないとして、
文字データとの比較を出来る限りヒットさせたいのですが。。。
使用している言語はPHPですが、C言語もできるのでCの回答でもかまいません。
現在、GDライブラリを用いて画像の各座標のRGBを取得するところまでは完成しました。
そこから文字の色のついた部分を1とし、背景を0にしてあらかじめデータベースに保管してある
a-zA-Z0-9までの文字データと比較して文字を判別させようと思っているのですが、他の方法はありますでしょうか?
また、比較方法はどのようにしたらいいでしょうか?
完全一致だと同じフォント、同じサイズ、同じ座標に文字がないと不一致になるかと思います。
似ている文字(たとえば、数字の0とアルファベットのO)など誤字が発生するのは仕方ないとして、
文字データとの比較を出来る限りヒットさせたいのですが。。。