gpt4 book ai didi

java - 如何获取包含javascript内容的html内容?

转载 作者:行者123 更新时间:2023-12-02 08:27:32 27 4
gpt4 key购买 nike

我需要获取网页上的内容并通过 URL 读取它,但内容不包含 javascript 上的数据,任何人都可以帮助我解决这个问题吗?例如:我想从URL获取bibtext内容'javascrip:http://portal.acm.org/citation.cfm?id=152610.152611&coll=DL&dl=GUIDE&CFID=111326695&CFTOKEN=18291914我如何从 (1) alt text 获取内容 (2)

最佳答案

根据快速观察,我会这样做:

1/获取该网页内容:http://portal.acm.org/citation.cfm?id=152610.152611&coll=DL&dl=GUIDE&CFID=111326695&CFTOKEN=18291914

2/使用正则表达式搜索“BibTeX”并在内容中找到以下字符串:

<li style="list-style:disc; display:inline; margin-bottom:0px;"><a href="javascript:ColdFusion.Window.show('theformats');ColdFusion.navigate('exportformats.cfm?id=152611&amp;expformat=bibtex','theformats');" class="small-link-text">BibTeX</a></li>

3/使用另一个正则表达式来捞出:

exportformats.cfm?id=152611&amp;expformat=bibtex

4/将其连接到 url(确保将 & 解码为 &):

“http://portal.acm.org/”+“exportformats.cfm?id=152611&expformat=bibtex”

5/捕获您正在寻找的内容。最终http://portal.acm.org/exportformats.cfm?id=152611&expformat=bibtex为您提供内容。

关于java - 如何获取包含javascript内容的html内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4201439/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com