gpt4 book ai didi

javascript - 如何通过匹配 BeautifulSoup 中 href 属性中的文本来获取元素

转载 作者:行者123 更新时间:2023-12-03 07:32:18 25 4
gpt4 key购买 nike

网站有几个href标签,我通过文本来解析它。例如,

<a href="#goUrl" onClick="javascript:goUrl('/board/list.do?boardID=1111&m=100&s=111', 'N')">test1</a>
<a href="#goUrl" onClick="javascript:goUrl('/board/list.do?boardID=1111&m=200&s=111', 'N')">test2</a>
<a href="#goUrl" onClick="javascript:goUrl('/board/list.do?boardID=1111&m=300&s=111', 'N')">test3</a>"

我用过

bs = getBeautifulSoupRequests(board_url)
result = bs.findAll('a', href=True, text='test1')

和结果

"<a href="#goUrl" onClick="javascript:goUrl('/board/list.do?boardID=1111&m=100&s=111', 'N')">test1</a>

但是我想要得到如下结果

/board/list.do?boardID=1111&m=100&s=111

我应该做什么?

最佳答案

你们已经很接近了。您只需获取 onclick 属性的值并从那里提取链接。您可以使用正则表达式模式来匹配链接,或者使用快速而肮脏的 split() ,如下所示:

from bs4 import BeautifulSoup

html = '''<a href="#goUrl" onClick="javascript:goUrl('/board/list.do?boardID=1111&m=100&s=111', 'N')">test1</a>
<a href="#goUrl" onClick="javascript:goUrl('/board/list.do?boardID=1111&m=200&s=111', 'N')">test2</a>
<a href="#goUrl" onClick="javascript:goUrl('/board/list.do?boardID=1111&m=300&s=111', 'N')">test3</a>"'''

soup = BeautifulSoup(html)
for t in soup.find_all('a', href=True, onclick=True, text='test1'):
onclick = t['onclick'].split("'")[1]
print(onclick)

输出

/board/list.do?boardID=1111&m=100&s=111

关于javascript - 如何通过匹配 BeautifulSoup 中 href 属性中的文本来获取元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35767436/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com