gpt4 book ai didi

php - 用于从 HTML 中提取所有链接和 anchor 文本的正则表达式

转载 作者:可可西里 更新时间:2023-10-31 23:53:08 26 4
gpt4 key购买 nike

我想要一个或多个可以:

1) 获取一个大页面的html。

2)查找所有链接中包含的url,例如:

<a href="http://example1.com">Test 1</a>
<a class="foo" id="bar" href="http://example2.com">Test 2</a>
<a onclick="foo();" id="bar" href="http://example3.com">Test 3</a>

依此类推,它应该提取包含在'href'属性中的url,而不管href

之前或之后的内容

3) 提取所有链接的 anchor 文本,比如上面的例子,应该返回'http://example1.com'和 anchor 文本'Test 1',然后是'http://example2.com ' 和 '测试 2',等等。

最佳答案

<?

$dom = new DomDocument();
$dom->loadHTML($html);
$urls = $dom->getElementsByTagName('a');

关于php - 用于从 HTML 中提取所有链接和 anchor 文本的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4624848/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com