apple

フォーラム(掲示板)ルール
フォーラム(掲示板)ルールはこちら  ※コードを貼り付ける場合は [code][/code] で囲って下さい。詳しくはこちら
pythonを使った文字列取得

apple

#1

投稿記事 by pythonを使った文字列取得 » 10年前

pythonを用いて、サイトのソースから”http://~~~~~~~~~~~~.jpeg"となっている文字列を取得したい。
サイトのソースには様々な文字列がありどのようにしてたくさんの文字列からhttpから始まり.jpegで終わるurlを取り出せるかコードを明示して教えて欲しいです。

アバター
みけCAT
記事: 6734
登録日時: 15年前
住所: 千葉県
連絡を取る:

Re: apple

#2

投稿記事 by みけCAT » 10年前

pythonを使った文字列取得 さんが書きました:pythonを用いて、サイトのソースから”http://~~~~~~~~~~~~.jpeg"となっている文字列を取得したい。

コード:

# coding: UTF-8

import re

サイトのソース = """
http://example.com/aaa/bbb.jpg
https://example/com/aaa/ccc.jpeg
asdfjaiopsfjaohttp://ejfsafjpegsdfsafsfd.jpegggaadvasdvaoeatj
http://dfasjdfoija/jojojoj.jpg
weejpajfasjgsa
gaepgspgesgsee.jpg
fsdifoasjdfasfefes.jpeg
"""

取り出したやつ = re.compile('http://[\s\S]*?\.jpeg').findall(サイトのソース)

print(取り出したやつ)
pythonを使った文字列取得 さんが書きました:サイトのソースには様々な文字列がありどのようにしてたくさんの文字列からhttpから始まり.jpegで終わるurlを取り出せるかコードを明示して教えて欲しいです。
Uniform Resource Locators (URL)
を見て、上のコードと同様に条件を満たすurlにマッチする正規表現を使えばできるはずです。
すぐには書けませんが…
オフトピック
まさかPythonを用いた画像保存と同じ人じゃないだろうなあ…
複雑な問題?マシンの性能を上げてOpenMPで殴ればいい!(死亡フラグ)

apple

Re: apple

#3

投稿記事 by apple » 10年前

みCATさん回答ありがとうございます。
ソース内のhttp://****.jpgのURlを上から順に取得したいのですが、先ほど提示していただいた方法だと一番上のURLしか取得できません。どのようにすれば、ソースにあるURLをすべて取得できますか?

閉鎖

“C言語何でも質問掲示板” へ戻る