matobaの備忘録

和歌山と東京を往復しつつ活動するエンジニアの記録

Pythonで文字列からURLを抽出したい時に使えるライブラリ

Pythonで文字列からURLを抽出したいなあ。でも正規表現を書くのは嫌だなあ。という気持ちになりました。

ライブラリ探したら見つかった&日本語記事だと正規表現ばかり紹介されていたので、書いておきますね。

github.com

Welcome to urlextract’s documentation! — urlextract 1.8.0 documentation

インストール

pip install urlextract

使ってみる

>>> from urlextract import URLExtract
>>> extractor = URLExtract()
>>> text = "Pythonで文字列からURLを抽出したい時に使えるライブラリを探していたら、 https://github.com/lipoja/URLExtract が見つかりました。"
>>> urls = extractor.find_urls(text)
>>> print(urls)
['https://github.com/lipoja/URLExtract']

余談

ちなみにライブラリは、 Pythonで文字列からURLを抽出したいけど、正規表現書きたくない。いい感じのライブラリありますか? みたいな雑な問をChatGPTに聞いたら出てきました。