gpt4 book ai didi

python - 用于捕获元素 textContent 的正则表达式

转载 作者:太空宇宙 更新时间:2023-11-04 11:19:33 26 4
gpt4 key购买 nike

只是想从网站上获取事件的标题,我有大部分,但它不会获取一个标题。缺少的结果是:

AFL U16’s Championships

谁能告诉我需要在正则表达式中更改什么才能找到它?

from re import *
from urllib.request import urlopen

Website = 'https://thegabba.com.au/what-s-on.aspx'
print('Now Gathering Results from URL: ' + Website)

html_source = urlopen(Website).read().decode("UTF-8")
EventMatches = findall('<h6 class="event-title">([A-Za-z0-9\'\\s]+)</h6>',html_source)

print('There are ' + str(len(EventMatches)) + ' Events.')

for EventNames in EventMatches:
print(EventNames)

最佳答案

撇号 ' 与单引号 ' 相同。如果您希望包含该结果,则需要考虑前者和后者。

关于python - 用于捕获元素 textContent 的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56301250/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com