gpt4 book ai didi

php - 使用正则表达式从网站的 HTML 源代码中提取内容

转载 作者:可可西里 更新时间:2023-11-01 01:04:58 25 4
gpt4 key购买 nike

<分区>

我正在尝试修复以下代码。

代码:

$pageData = file_get_contents('111234-2.html');
if(preg_match_all('/<a\s+onclick=["\']([^"\']+)["\']/i', $pageData, $links, PREG_PATTERN_ORDER))
print_r(array_unique($links[1]));
return false;

我希望它从中获取的一些示例 HTML:

    <a onclick="doShowCHys=1;ShowWindowN(0,'http://www.example.com/home/Player.aspx?lpk4=116031&amp;playChapter=False',960,540,111234);return false;" href="javascript:void(0);">
<span class="vt">Welcome

</span>
<span class="dur">1m 10s</span>
<span class="" id="bkmimgview-116031">&nbsp;</span>
<br class="clear">
</a>

我得到的输出:

Array ( [0] => doShowCHys=1;ShowWindowN(0, )

我希望的输出:

Array ( [0] => doShowCHys=1;ShowWindowN(0,'http://www.example.com/home/Player.aspx?lpk4=116031&amp;playChapter=False',960,540,111234);return false;)

我如何实现这一目标?

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com