gpt4 book ai didi

python - 类型错误 : decoding Unicode is not supported python

转载 作者:行者123 更新时间:2023-11-28 18:47:34 25 4
gpt4 key购买 nike

我正在使用 lxml.html 来解析 html 文件并从页面中获取文本。现在我有一个字符串,它有一个字符 ' 例如 Florian's 因此,在打印输出时我得到了回溯

parent_link_id_text =  parent_link_id.xpath('./td[@width="400"]/text()')
print (SGS_Mid[0]+";"+"External"+";"+str(link_id_num[0])+";"+parent_link_id_text[0]+";"+parent_link_link[0], file = log_file_1)

UnicodeEncodeError: 'ascii' codec can't encode characters in position 56-58: ordinal not in range(128)

然后我试了一下

print (SGS_Mid[0]+";"+"PublicFreeUrl"+";"+str(link_id_num[0])+";"+unicode(parent_link_id_text[0],"utf-8")+";"+parent_link_link[0], file = log_file_1)

然后我得到一个回溯:

TypeError: decoding Unicode is not supported

如何通过打印带有 unicode 字符的字符串来解决这个问题?

最佳答案

不确定这是否是您问题的解决方案,但也许它会引导您朝着正确的方向前进。

在没有看到您必须实际获取数据的代码的情况下,我将推测并以编程方式猜测如何解决您的问题。

请看下面的代码:

import lxml.html as lh
import urllib2

url = 'http://loremipsum.net/about.html'

doc = lh.parse(urllib2.urlopen(url))

value = doc.xpath('//p/strong/text()')[0]

print value

打印结果:

What is 'lorem ipsum'?

通过阅读 lorem ipsum 站点上的关于页面,您可以看到返回的文本中确实包含 '。

我希望这能帮助您朝着正确的方向前进。

关于python - 类型错误 : decoding Unicode is not supported python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17701130/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com