手書きではないtextを認識するプログラムを作りたい
手書きではないtextを認識するプログラムを作りたい
手書きではないテキストを認識するプログラムを作りたいです。正しテキストは画像形式であり、テキスト形式ではありません、つまりweb上やアプリ上に表示されてCtrl+Fで検知できるような状態ではなく画像処理が必須になる場合です。こういう時どんなアルゴリズムを使えばいいでしょうか?OCRで検索してみたんですが、あまりにも情報が乗っておらず困っています。唯一見つけたのは直線抽出とか曲線抽出とかいうものですが、これはどちらかというと手書き入力の場合じゃないかと思います。ゴシック形式、明朝形式と限定すればパターンは決まってるわけだから手書きよりかは楽に認識できると思うのですが、その方法が分かりません。なので力を貸してほしいです。教えて下さい。
Re: 手書きではないtextを認識するプログラムを作りたい
どういう時に必要かというとjpg画像で開いたときにテキストが映っている場合です。本をデジカメで撮った時の場合は、テキストとはいえゆがみとかが出てくるので手書き認識の範疇かもしれませんが、テキストをスクリーンキャプチャした場合だと元のパターンと同じですから、手書き認識ではない方法があると思っています。それが全く分からないので困っています。
Re: 手書きではないtextを認識するプログラムを作りたい
オフトピック
Google Schoolarあたりで
文字 フォント テキスト 認識 検出
letter word font text recognition detection
等々,適当にそれっぽい言葉の組み合わせで検索してみては?
文字 フォント テキスト 認識 検出
letter word font text recognition detection
等々,適当にそれっぽい言葉の組み合わせで検索してみては?
Re: 手書きではないtextを認識するプログラムを作りたい
usaoさん、そういった類を含めあらゆるキーワードで検索してもありませんでした。
スキャナ時にテキスト認識するなどの設定を紹介してるサイトならありましたが、やはりアルゴリズムの話になるので技術的な話はのってないのでしょうか。
スキャナ時にテキスト認識するなどの設定を紹介してるサイトならありましたが、やはりアルゴリズムの話になるので技術的な話はのってないのでしょうか。
Re: 手書きではないtextを認識するプログラムを作りたい
> やはりアルゴリズムの話になるので技術的な話はのってないのでしょうか。
アルゴリズムは技術的な話の内だと思うのですが。
> ゴシック形式、明朝形式と限定すればパターンは決まってるわけだから
> 手書きよりかは楽に認識できると思うのですが、その方法が分かりません。
フォントサイズによっても変わりますよね。
普通にニューラルネットワークなどで文字認識のプログラムをつくり、
パターンが決まっている分だけ判定の精度が上がる利点がある程度ではないでしょうか。
アルゴリズムは技術的な話の内だと思うのですが。
> ゴシック形式、明朝形式と限定すればパターンは決まってるわけだから
> 手書きよりかは楽に認識できると思うのですが、その方法が分かりません。
フォントサイズによっても変わりますよね。
普通にニューラルネットワークなどで文字認識のプログラムをつくり、
パターンが決まっている分だけ判定の精度が上がる利点がある程度ではないでしょうか。
Re: 手書きではないtextを認識するプログラムを作りたい
>やはりアルゴリズムの話になるので技術的な話はのってないのでしょうか
必要なのは 検出/認識を行うためのアルゴリズム なのではないのでしょうか?
フォントが決まっている程度では一般的な問題とほとんど条件は変わらないように私も思います.
必要なのは 検出/認識を行うためのアルゴリズム なのではないのでしょうか?
フォントが決まっている程度では一般的な問題とほとんど条件は変わらないように私も思います.
オフトピック
どんな画像を処理対象画像にできるか」という条件を絞れば絞るほど
その条件に依存した形での何かしらのやりようもあるでしょうが,
(どんな条件化で何をやりたいのかという状況は人によって異なるでしょうから)
自分と完全に一致する条件下での方法を探すのは大抵は難しいです.
例えば,
・背景は必ず白で,文字は必ず黒
・文字以外の要素(絵とか…?)は画像に含まれない
みたいな条件を設ければ,画像内から文字っぽい個所を探し出してくる処理は簡単化できるかもしれませんし,
・認識すべき文字の種類は極少数でしかない(例えば 0~9 の数字だけとか)
みたいな条件があれば,文字種類の認識処理を簡単な方法でやれるかもしれません.
・イタリックだの太字だの下線だのいうのは許容するのかどうか
・文字の並び方に法則があるのか無いのか
・文字同士が接触するとか重なるとかいう場合がどうの
・etc etc …
その条件に依存した形での何かしらのやりようもあるでしょうが,
(どんな条件化で何をやりたいのかという状況は人によって異なるでしょうから)
自分と完全に一致する条件下での方法を探すのは大抵は難しいです.
例えば,
・背景は必ず白で,文字は必ず黒
・文字以外の要素(絵とか…?)は画像に含まれない
みたいな条件を設ければ,画像内から文字っぽい個所を探し出してくる処理は簡単化できるかもしれませんし,
・認識すべき文字の種類は極少数でしかない(例えば 0~9 の数字だけとか)
みたいな条件があれば,文字種類の認識処理を簡単な方法でやれるかもしれません.
・イタリックだの太字だの下線だのいうのは許容するのかどうか
・文字の並び方に法則があるのか無いのか
・文字同士が接触するとか重なるとかいう場合がどうの
・etc etc …