Pythonで文字列からURLを抽出したいなあ。でも正規表現を書くのは嫌だなあ。という気持ちになりました。
ライブラリ探したら見つかった&日本語記事だと正規表現ばかり紹介されていたので、書いておきますね。
Welcome to urlextract’s documentation! — urlextract 1.8.0 documentation
インストール
pip install urlextract
使ってみる
>>> from urlextract import URLExtract >>> extractor = URLExtract() >>> text = "Pythonで文字列からURLを抽出したい時に使えるライブラリを探していたら、 https://github.com/lipoja/URLExtract が見つかりました。" >>> urls = extractor.find_urls(text) >>> print(urls) ['https://github.com/lipoja/URLExtract']
余談
ちなみにライブラリは、 Pythonで文字列からURLを抽出したいけど、正規表現書きたくない。いい感じのライブラリありますか?
みたいな雑な問をChatGPTに聞いたら出てきました。