gpt4 book ai didi

java - 如何提取位于页面源脚本标记内的字符串

转载 作者:行者123 更新时间:2023-11-30 11:16:18 25 4
gpt4 key购买 nike

我有一个网页,例如 www.educaxx.com。检查页面源后,我可以看到编写了一个脚本。该脚本写在页面的head标签内。

        <script type="text/javascript">
if ( /\.eduxx\.com/g.test( document.domain ) ) {
var _gaq = _gaq || [];
_gaq.push(['_setDomainName', 'eduxx.com']);
_gaq.push(['_setAccount', 'UA-48621467-1']);
_gaq.push(['_trackPageview']);
_gaq.push(['jiveTracker._setAccount', 'UA-1066095-1']);
_gaq.push(['jiveTracker._trackPageview']);
}
</script>

我想使用 selenium webdriver 从这个网页中找到字符串“_gaq”?我如何使用 JavascriptExecutor 使其成为可能?

最佳答案

获取页面源并将其存储在一个字符串中,然后您可以使用下面的代码,可能是 self 描述的,

    ArrayList<String> value_to_get= new ArrayList<String>();
String regex= "(\\W|^)_gaq(\\W|$)";
Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(page_source);

while(m.find()) {

if(!value_to_get.contains(m.group())){
value_to_get.add(m.group())
}
}

关于java - 如何提取位于页面源脚本标记内的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24933786/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com