gpt4 book ai didi

c++ - Boost正则表达式、正则表达式、url和img

转载 作者:搜寻专家 更新时间:2023-10-31 01:14:56 25 4
gpt4 key购买 nike

我需要在网页的 HTML 源代码中找到所有链接和图像。其实我有以下表达:

boost::regex findurl("(?s)<\\s*a\\s+.*?href\\s*=\\s*['\"]([^http]{1}[^\\s>]*)['\"]", boost::regex::normal | boost::regbase::icase);

查找图像(标签)应该是什么样子?

最佳答案

与调试这个不适用于病态 HTML 的正则表达式相比,学习 Perl 和使用 HTML::Parser 花费的时间更少。我已经可以在链接中发现三个错误,即使您只询问图像。

这包括示例代码,即使您不了解 Perl,您也可能会弄清楚如何修改这些代码。 http://perlmeme.org/tutorials/html_parser.html

关于c++ - Boost正则表达式、正则表达式、url和img,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10710679/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com