gpt4 book ai didi

python - 强制转换为 Unicode : need string or buffer, 找到标记

转载 作者:太空狗 更新时间:2023-10-30 02:46:33 24 4
gpt4 key购买 nike

我正在尝试进行网络抓取并使用以下代码:

import mechanize
from bs4 import BeautifulSoup

url = "http://www.indianexpress.com/news/indian-actions-discriminating-against-us-exp/1131015/"
br = mechanize.Browser()
htmltext = br.open(url).read()
articletext = ""
soup = BeautifulSoup(htmltext)
for tag in soup.findAll('p'):
articletext += tag.contents[0]
print articletext

但我收到以下错误:

Traceback (most recent call last):
File "C:/Python27/crawler/express.py", line 15, in <module>
articletext += tag.contents[0]
TypeError: coercing to Unicode: need string or buffer, Tag found

谁能帮我解决这个错误,我是 Python 编程的新手。

最佳答案

对于至少一个 <p>找到标签,tag.contents[0]Tag对象,而不是文本。对于您找到的特定 URL,它是 <hr>标签:

>>> tag
<p><hr> </hr></p>

为什么不使用 tag.text而不是 tag.contents[0]

for tag in soup.findAll('p'):
articletext += tag.text

关于python - 强制转换为 Unicode : need string or buffer, 找到标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19917622/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com