gpt4 book ai didi

python - 解析表中的文本不起作用

转载 作者:太空宇宙 更新时间:2023-11-03 15:56:49 25 4
gpt4 key购买 nike

我正在尝试在标签中获取以下文本。

<td align="center" valign="top">I AM TRYING TO GET THIS</td>

这是在一个表中,这个特定的文本是特定的行和列,我试图将其与该列的其余部分一起获取。

我尝试过 for 循环,也尝试过这个:

r = driver.get("url")

htmltext = htmlfile.read()

regex = '<td align="center" valign="top">(.+?)</td>'

pattern = re.compile(regex)

grade = re.findall(pattern,htmltext)

print(grade)

我更喜欢 BS4 方式来做到这一点。

最佳答案

我无法检查它,但它应该可以工作

import requests
from bs4 import BeautifulSoup

url = 'http://www.w3schools.com/html/html_tables.asp'

r = requests.get(url)

soup = BeautifulSoup(r.text, 'html.parser')

for x in soup.find_all('td'):
print(x.text.strip())

关于python - 解析表中的文本不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40705341/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com