ページ 11

重要な情報を検索する方法

Posted: 2012年11月19日(月) 14:22
by ゆうたろう
あなたは動画サイトの管理人です
あなたはもしかして何千何万もある動画の中から埋もれてるおもしろい動画があるのではないかと
思いプログラミングで探すことにしました。
動画情報で与えられるのは再生数、コメント数、ブックマーク数です
ただ単に再生数が高いのを検索するだけなら埋もれてる動画ではありません
再生数は少ないはずです
コメント数、ブックマーク数も然り再生数が多ければ自然と比例してブクマする人も多くなり
これだけでは判断できないかもしれません
みなさんはどうやっておもしろい動画を探しますか?

ちなみにgoogleは貴重な情報かどうかはそのページの被リンク数で重要度を判断してます
動画でいうならブクマ数です

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 14:40
by softya(ソフト屋)
すいません。広告かと思いました。
アルゴリズムの質問なら最初に断って頂くと良いと思います。

人間の直感・感覚的なものをアルゴリズムに置き換えるのは大変困難です。
どちらかと言うとAI(人工知能)の分野になりますので、そちらを勉強された方が良いでしょう。

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 14:43
by beatle
それだけで学術研究になりそうなレベルの質問ですね。
「おもしろさ」は主観的な尺度ですので、万人に共通するおもしろさを持つ動画を探すことはできません。
ということで、作るとすれば個人向けに(または同じような興味を持つ人のグループ向けに)カスタマイズされたおもしろ動画検索プログラムになると思います。

まず、全動画の特徴量をデータベース化します。
個人に幾つかの動画サンプルを見せて、その人の興味の特徴量を抽出します。
データベースから、その人の興味の特徴量と同じような特徴量を持つ動画を持ってきます。

こんな感じでしょうか。
動画から特徴量を取り出すところが非常に難しいわけですが。

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 14:57
by ゆうたろう
人工知能は関係無いと思います><
動画情報でソートして上に表示させるだけなので。
ブクマ数÷再生数とかソートする計算式をどうするかということですね

>データベースから、その人の興味の特徴量と同じような特徴量を持つ動画を持ってきます。
おすすめ動画みたいなことでしょうか。
埋もれてる動画をさがすのでちょっとニュアンスが違う気がします

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 15:01
by softya(ソフト屋)
私とbeatleさんに共通しているのは、ブクマ数÷再生数だけで判別できるはずがないと思っているところでしょう。
それ以外の情報を何らかの形で特徴量にする必要があると言うことです。なので、そういう意味合いの提案となっております。

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 15:03
by beatle
再生数、コメント数、ブックマーク数だけから判断するとすれば、
例えば再生数の割にコメント数やブックマーク数が多い動画は面白い可能性があるね、
くらいは言えるかもしれません。

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 15:07
by ゆうたろう
特微量とは具体的にはどういう情報でしょうか

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 15:12
by beatle
思いつく簡単なものでは、動画の長さに対する再生時間の割合(の平均値)とか、再生数の推移とかですかね。
難しい特徴量には、動画の中の登場人物の数とか、シーンの切り替わり回数とか、動画の全体的な色とか。
もっと難しいものでは、物語の構成(起承転結など)とか、旬のネタがいくつ入っているかとか。

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 15:17
by softya(ソフト屋)
beatle さんが書きました:思いつく簡単なものでは、動画の長さに対する再生時間の割合(の平均値)とか、再生数の推移とかですかね。
難しい特徴量には、動画の中の登場人物の数とか、シーンの切り替わり回数とか、動画の全体的な色とか。
もっと難しいものでは、物語の構成(起承転結など)とか、旬のネタがいくつ入っているかとか。
こういう傾向を自動学習するのに人工知能を使うのが有効です。
それと学習結果の合否を随時調整してやる手間もあります。

ワトソンを作るようなものですからね。
「ワトソン (コンピュータ) - Wikipedia」
http://ja.wikipedia.org/wiki/%E3%83%AF% ... %E3%82%BF)

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 15:23
by ゆうたろう
再生数の推移は取得可ですがそれ以外のは取得できません。。。
(そこまでの細かい情報が必要でしょうか・・・・)
要は動画ランキングみたいなものです
某ちくわランキングは単純にコメント数が多いほど上に表示されるらしいです
最近のyoutube運営はその動画の滞在時間で重要度を判断してるという記事を見たことありますが
どうなんでしょう

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 15:31
by softya(ソフト屋)
曖昧な基準:埋もれてるおもしろい動画
って事ですので、それは非常に難しいですとお断りしてますが ゆうたろうさんは 簡単に済ませたいんですよね?

beatle さんの提案された「再生数の割にコメントが多い」ってのは簡単に済ませる一つの選択肢だと思います。
それでは問題があるのでしょうか?

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 15:34
by beatle
ゆうたろう さんが書きました:再生数の推移は取得可ですがそれ以外のは取得できません。。。
(そこまでの細かい情報が必要でしょうか・・・・)
どこまでランキングの精度を出したいかにかかっています。

例えば利用する特徴量を「再生数」だけに限定した場合

・再生数が少ない動画を上位に並べるだけで、誤検出(面白くないのに面白いと判定されてしまう)は多いですけど、面白くて埋まっている動画はすべて上位になるはずです。

・逆に、再生数が多い動画を上位に並べるだけで、誤検出がなくなる代わりに、埋もれたおもしろ動画を探すことはできません。

どの特徴量をいくつ利用するにせよ、どう組み合わせたら埋もれた「面白い」動画を探せるかに対する正解はない(もしくは発見されていない)と思いますよ。
研究のしどころだと思います。
もし、特徴量の組み合わせ方に関して理論を構築できたら、それを動画サイトに売ると儲かると思います。

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 15:49
by ゆうたろう
プログラミングじゃなくて人の習性みたいなものですよね
人は面白い動画を見つけたらコメントする
とかクオリティの高い動画を見つけたらブクマするとか
それで再生数の少なくてブクマが多い動画(ブクマ比)が多いほど
面白い動画が見つかると思ったんですが
実際ふるいにかけてそれでどういう動画が上にくるか見る必要がありそうですね
まあそういう定義はないので確実とはいえませんが

Re: 重要な情報を検索する方法

Posted: 2012年11月19日(月) 18:09
by nil
失礼します。

コメントの多い動画ほど面白いというのもあまりあてにはなりませんね。
確かに笑えるような動画ならコメントも多いでしょうが、
見入るような動画では必然少なくなります。
逆にコメントが多くてもその多くが罵声であれば面白くはないでしょう。

再生数/ブクマ数, ブクマ数/コメント数など多角的に判断するべきでしょうね。