URLを取り出す正規表現

フォーラム(掲示板)ルール
フォーラム(掲示板)ルールはこちら  ※コードを貼り付ける場合は [code][/code] で囲って下さい。詳しくはこちら
ccc+++

URLを取り出す正規表現

#1

投稿記事 by ccc+++ » 5年前

コード:

<div class="rc" data-hveid="31"></div>の中にある
<h3 class="r"></h3>の中にある

<a>タグの中にあるhref属性

をとりだす正規表現はどのように書けばよいでしょうか。



下記の入れ子になっているソースの場合

http://ja.wikipedia.org/wiki/PHP:_Hypertext_Preprocessor

を取り出すことになります。



<div class="rc" data-hveid="31">
<h3 class="r">
<a onmousedown="return rwt(this,'','','','1','AFQjCNHP46Qyp87823XLbcO6pn4iLw0lyA','','0CCAQFjAA','','',event)" href="http://ja.wikipedia.org/wiki/PHP:_Hypertext_Preprocessor">
</h3>
</div>


よろしくお願い致します。


アバター
h2so5
副管理人
記事: 2212
登録日時: 9年前
住所: 東京
連絡を取る:

Re: URLを取り出す正規表現

#2

投稿記事 by h2so5 » 5年前

正規表現を利用するより、HTMLパーサーを導入したほうが良いのではないかと思います。

ccc+++

Re: URLを取り出す正規表現

#3

投稿記事 by ccc+++ » 5年前

返信ありがとうございます。

事情があってどうしても正規表現で行いたいと考えています。

HTMLパーサーは別途考慮させていただきます。

どうぞよろしくお願いいたします。

アバター
へにっくす
記事: 630
登録日時: 8年前
住所: 東京都

Re: URLを取り出す正規表現

#4

投稿記事 by へにっくす » 5年前

以下が参考になりませんかね。

【正規表現】 preg_replace()を使用して、URL文字列をHTMLのリンク形式に置換する方法

PHPですけど、
正規表現そのものはそのまま使えると思いますが。

あるいは知恵袋のこれとか。
正規表現でアンカータグのURLを抽出したいです
written by へにっくす

ccc+++

Re: URLを取り出す正規表現

#5

投稿記事 by ccc+++ » 5年前

返信ありがとうございます。

いただいたヒントを頼りに頑張ってみます。

閉鎖

“C言語何でも質問掲示板” へ戻る