gpt4 book ai didi

python - 坚持使用 BeautifulSoup 在 python 中进行编码

转载 作者:太空宇宙 更新时间:2023-11-04 01:37:15 25 4
gpt4 key购买 nike

该页面以 UTF-8 编码,使用 python 的 HTMLParser 时效果很好,没有 UnicodeDecodeError,但是当我尝试使用 BeautifulSoup 解析它时确实遇到错误。我试过 _*_ coding: utf-8 _*_, .encode('utf-8') 无处不在,我仍然得到错误

import urllib
from BeautifulSoup import BeautifulSoup
args=urllib.urlencode({'keywords':'magic'})
doc=urllib.urlopen('http://www.example.com/submit', args)
soup=BeautifulSoup(doc)
stuff = soup.findAll('section',id='banner')
print stuff

Traceback (most recent call last):
File "test.py", line 7, in <module>
print stuff
UnicodeEncodeError: 'ascii' codec can't encode character u'\xed' in position 112: ordinal not in range(128)

最佳答案

好的,我在上次尝试中找到了解决方案,也许它会对遇到同样问题的其他人有所帮助。它需要编码,而不是解码

print( [e.encode('utf-8', 'ignore') for e in stuff] )

关于python - 坚持使用 BeautifulSoup 在 python 中进行编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8688274/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com