gpt4 book ai didi

python - 解析包含不间断空格字符的unicode文件

转载 作者:行者123 更新时间:2023-12-01 04:29:38 26 4
gpt4 key购买 nike

我正在使用 BeautifulSoup 解析 HTML 页面,以便查找和提取指定的项目。

据我所知,问题是BeautifulSoup和Python解析器之间的冲突导致了这个问题。我正在 HTML 中寻找特定文本,该文本将引导我找到要提取的 anchor 标记。我似乎不太能解决这个问题。这是我的代码:

with requests.Session() as s:
r = s.get('https://www.rbkc.gov.uk/planning/searches/details.aspx?batch=20&id=PP/11/04187&type=&tab=#tabs-planning-6')
c = s.cookies.get_dict()
soup = BeautifulSoup(r.text, 'lxml')
table = soup.find('table', {'id': 'casefiledocs'})

vals = []
rows = table.findAll('tr')
for tr in rows:
cols = tr.findAll('td')
for td in cols:
if td.get_text().encode('utf-8') == 'Application Form':
print td

谁有办法解决这个问题吗?欣赏它。

最佳答案

去掉空格即可:

if td.get_text().strip() == 'Application Form':
...

关于python - 解析包含不间断空格字符的unicode文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32552867/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com