サイトのソース内に下記のようなソースがあります。
<meta property="og:description" content="正規表現勉強中!"/>
上記の”正規表現勉強中!”と書いてあるところを取得したいです。そこには日本語だけでなく、カタカナ、数字、漢字などすべてを含みます。
私が考えた正規表現は
<meta property="og:description" content="((?:.|\n)+)"/>
上記のものなのですが、日本語が適切に表示されず、<meta property="og:description" content="以降のものをすべて含んでしまいます。
” <meta property="og:description" content=" ” この文字列の後ろにあるものを取得したいです。
正規表現について
Re: 正規表現について
naohiro19さんみけCATさんYuOさん回答ありがとうございます。
返信遅れてしまいすいません。
試してみましたが、できませんでした。
”<meta property="og:description" content="([^"]*)"/>”この正規表現を実行して結果下記のようになり、タイトルが取れていませんでした。
['<meta property="og:description" content="']
タイトルが日本語だから表示されない、など関係あるのでしょうか?
返信遅れてしまいすいません。
試してみましたが、できませんでした。
”<meta property="og:description" content="([^"]*)"/>”この正規表現を実行して結果下記のようになり、タイトルが取れていませんでした。
['<meta property="og:description" content="']
タイトルが日本語だから表示されない、など関係あるのでしょうか?
Re: 正規表現について
そもそも,結果がこのようになることはない (「"/>」というリテラルで終わる正規表現なので,マッチしたならば必ずこの文字列で終わる) のですが,どのように確認したのでしょうか。super さんが書きました:試してみましたが、できませんでした。
”<meta property="og:description" content="([^"]*)"/>”この正規表現を実行して結果下記のようになり、タイトルが取れていませんでした。
['<meta property="og:description" content="']
タイトルが日本語だから表示されない、など関係あるのでしょうか?
putwsやstd::wcoutなどを使って出力しているのにロケール設定をしていない,などということはないでしょうか。
Re: 正規表現について
そう思うなら、まずタイトルが英数字だけのデータを入力してテストし、問題を切り分けるといいと思います。super さんが書きました:タイトルが日本語だから表示されない、など関係あるのでしょうか?
複雑な問題?マシンの性能を上げてOpenMPで殴ればいい!(死亡フラグ)
Re: 正規表現について
私の手違いで違うディレクトリの同じ名前のファイルを実行していました。
本当にすいません。
目指していた通りにタイトルを取得できました。
たくさんのご回答ありがとうございました。
本当にすいません。
目指していた通りにタイトルを取得できました。
たくさんのご回答ありがとうございました。