pythonを用いて、サイトのソースから”http://~~~~~~~~~~~~.jpeg"となっている文字列を取得したい。
サイトのソースには様々な文字列がありどのようにしてたくさんの文字列からhttpから始まり.jpegで終わるurlを取り出せるかコードを明示して教えて欲しいです。
apple
Re: apple
pythonを使った文字列取得 さんが書きました:pythonを用いて、サイトのソースから”http://~~~~~~~~~~~~.jpeg"となっている文字列を取得したい。
# coding: UTF-8
import re
サイトのソース = """
http://example.com/aaa/bbb.jpg
https://example/com/aaa/ccc.jpeg
asdfjaiopsfjaohttp://ejfsafjpegsdfsafsfd.jpegggaadvasdvaoeatj
http://dfasjdfoija/jojojoj.jpg
weejpajfasjgsa
gaepgspgesgsee.jpg
fsdifoasjdfasfefes.jpeg
"""
取り出したやつ = re.compile('http://[\s\S]*?\.jpeg').findall(サイトのソース)
print(取り出したやつ)
Uniform Resource Locators (URL)pythonを使った文字列取得 さんが書きました:サイトのソースには様々な文字列がありどのようにしてたくさんの文字列からhttpから始まり.jpegで終わるurlを取り出せるかコードを明示して教えて欲しいです。
を見て、上のコードと同様に条件を満たすurlにマッチする正規表現を使えばできるはずです。
すぐには書けませんが…
オフトピック
まさかPythonを用いた画像保存と同じ人じゃないだろうなあ…
複雑な問題?マシンの性能を上げてOpenMPで殴ればいい!(死亡フラグ)