gpt4 book ai didi

regex - 如何grep文件中的URL?

转载 作者:行者123 更新时间:2023-12-04 18:46:20 24 4
gpt4 key购买 nike

例如,我有一个巨大的 HTML 文件,其中包含 img URL:http://ex.example.com/hIh39j+ud9wr4/Uusfh.jpeg

我想得到这个 URL,假设它是整个文件中唯一的 URL。

cat file.html | grep -o 'http://ex[a-zA-Z.-]*/[a-zA-Z.-]*/[a-zA-Z.,-]*'

这个作品 只有如果 URL 没有加号。

我如何为 + 符号工作?

最佳答案

您错过了字符类 0-9 (也无用的使用 cat):

grep -o 'http://ex[a-zA-Z.-]*/[a-zA-Z0-9+-]*/[a-zA-Z0-9.,-+]*' file.html

略有改进,使用 -i不区分大小写且仅匹配图像 .jpg.jpeg .
grep -io 'http://ex[a-z.-]*/[a-z0-9+-]*/[a-z0-9.,-+]*[.jpe?g]' file.html

或者如何:
grep -io 'http://ex.example.*[.jpe?g]' file.html

关于regex - 如何grep文件中的URL?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13611973/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com