ご無沙汰しています。kazuoniです。
就活も一段落し、あとは研究に打ち込むだけになりました。
(学会のMIRUやICPRにもでなければならないですけど・・・)
今研究の一環で”多面体”の「直線検出」を頑張っています。
入力は2次元画像、出力は直線情報(この画素からこの画素まで直線!みたいな)。
直線検出なんて既存の手法を用いたらいいですよって話になりますよね。
でもこれが一筋縄ではいかないんです。
例えば
http://blog.livedoor.jp/juggleryou/arch ... 34344.html
のサイトの下にある画像のHoughを見るとわかるんですけど、
既存でよく使われる「ハフ変換」で「実画像の直線検出」を行うのはかなり難しいです。
そこで同サイトで紹介されている「LineSegmentDetector」ではどうでしょうか。
ハフ変換よりは確かに直線らしい直線がより検出されているようです。
(処理に時間がかかりますが・・・)
でもやっぱりもう少し精度よく検出したい。
また、実際直線検出を行うと、同一辺でも直線が途切れ途切れになる問題もどうにかしたい。
実際の多面体の辺が理想的に細く、検出しやすい状態なことってほとんど無いんですよね。
考えるべき問題は以下の二点
1、もっと”多面体”の辺を直線として検出したい!
2、同一辺で途切れ途切れになる直線を一つの辺としたい!
項目2に関しては。
・近傍の直線に対して「直線の傾き」でグループ化し、Cannyのエッジ抽出結果と統合→長い一辺の直線へ
することでまず取り組んでみようかなと。
項目1に関してはどうしましょう。
・・・ ・・・
・・・
。
いい案ありませんか?
直線検出とその先
RE: 直線検出とその先
全く専門でも何でもないんですけど、画像のみの情報から直線(であるべき)部分を検知するのってどれくらい妥当性(というかそれっぽさというか)を持てるんでしょうね?
人間の輪郭検知能力が実現できるのならそれは超すごいレベルじゃないかと思うんですが、実際問題人間がやってる方法ってどちらかというと直線認識というよりは
パターンの認識に近いような気がするんですよね。小っちゃい子が描く絵とかが本質的に人間がとらえてる世界だと思うんです。
例を挙げると、人が画像をみて輪郭を抽出するとき
「こことここの色が違うからここは分かれている(輪郭が存在する)」
とするのは全体の中でごく一部分であって、さらにそこから
「これはおそらく直方体だからこの部分の色の違いは判別しにくいけど輪郭であるはずだ」
とする部分が大半を占めるような気がします。というよりもそれをやってから具体的に直線とかを認識してると思うんですよ。
だってじゃなかったらモザイク画とかわからないと思うんですよね。
しかも隠れてる部分の形とか容易に想像できるじゃないですか。
そういった意味ではLSDみたいなミクロ→マクロとする輪郭認識のアルゴリズムのみでは限界があるような気がするんですが・・・わからないっすw
どっちかっていうとマクロの認識からミクロの認識がなされていくような気がします。
つまるところまず直方体とか球とかを当てはめてみて、そのなかで
重なっていて本来見えないと思われるような部分がどんどん除去されていった結果直線の領域ができる・・・みたいな
それっぽい認識結果を得ようと思ったら、とっかかりの大雑把な認識(LSDみたいな)の後に、それをもとにしたパターン認識が
必要なようなきがするんですがどうなんでしょう?そうしたら、ハフとかLSDみたいな認識で得られなかった部分の直線も得られるうえ、
不要な線が消え、分かれていた直線が一つに!!・・・なんてことにはならないんですかね?・・・ならないんでしょうねw
よくわかりませんけどね!!!
人間の輪郭検知能力が実現できるのならそれは超すごいレベルじゃないかと思うんですが、実際問題人間がやってる方法ってどちらかというと直線認識というよりは
パターンの認識に近いような気がするんですよね。小っちゃい子が描く絵とかが本質的に人間がとらえてる世界だと思うんです。
例を挙げると、人が画像をみて輪郭を抽出するとき
「こことここの色が違うからここは分かれている(輪郭が存在する)」
とするのは全体の中でごく一部分であって、さらにそこから
「これはおそらく直方体だからこの部分の色の違いは判別しにくいけど輪郭であるはずだ」
とする部分が大半を占めるような気がします。というよりもそれをやってから具体的に直線とかを認識してると思うんですよ。
だってじゃなかったらモザイク画とかわからないと思うんですよね。
しかも隠れてる部分の形とか容易に想像できるじゃないですか。
そういった意味ではLSDみたいなミクロ→マクロとする輪郭認識のアルゴリズムのみでは限界があるような気がするんですが・・・わからないっすw
どっちかっていうとマクロの認識からミクロの認識がなされていくような気がします。
つまるところまず直方体とか球とかを当てはめてみて、そのなかで
重なっていて本来見えないと思われるような部分がどんどん除去されていった結果直線の領域ができる・・・みたいな
それっぽい認識結果を得ようと思ったら、とっかかりの大雑把な認識(LSDみたいな)の後に、それをもとにしたパターン認識が
必要なようなきがするんですがどうなんでしょう?そうしたら、ハフとかLSDみたいな認識で得られなかった部分の直線も得られるうえ、
不要な線が消え、分かれていた直線が一つに!!・・・なんてことにはならないんですかね?・・・ならないんでしょうねw
よくわかりませんけどね!!!
Re: 直線検出とその先
> GRAMさん
正直、GRAMさんのおっしゃる通りだと思います。
人間がどのように考えてるかを直感的に再現するならば、
物体形状のあてはめが必須だと思います。
実際、形状推定は考えていました(諦めました;;)。
正直、パターン認識の分野にまで手を出すと現状の問題がものすごく複雑化します。
(本当は一番の近道なんだと思いますが)
なので、今回はCV(computer vision)の分野で”さらに”を目指しています。
まあLSDに毛が生えたぐらいで満足してしまうかもしれません。
私がやってる研究のいくらかは「既存手法の改善」となっており、
既存手法との差別化ができればいいなー程度です(えっ
”多画像群からの”って縛りを付けて、もうちょっと考えてみようかなと思います。
コメントしていただきありがとうございました!
正直、GRAMさんのおっしゃる通りだと思います。
人間がどのように考えてるかを直感的に再現するならば、
物体形状のあてはめが必須だと思います。
実際、形状推定は考えていました(諦めました;;)。
正直、パターン認識の分野にまで手を出すと現状の問題がものすごく複雑化します。
(本当は一番の近道なんだと思いますが)
なので、今回はCV(computer vision)の分野で”さらに”を目指しています。
まあLSDに毛が生えたぐらいで満足してしまうかもしれません。
私がやってる研究のいくらかは「既存手法の改善」となっており、
既存手法との差別化ができればいいなー程度です(えっ
”多画像群からの”って縛りを付けて、もうちょっと考えてみようかなと思います。
コメントしていただきありがとうございました!