gpt4 book ai didi

python - 在python中将unicode字符列表转换为希伯来语字符串

转载 作者:行者123 更新时间:2023-12-04 06:16:05 33 4
gpt4 key购买 nike

关注 this线程解决方案,我设法得到了一堆列表,每个列表看起来像:

[u'\u05ea\u05d0\u05de\u05d9\u05df \u05dc\u05d9']



我假设这些是 unicode 字符,但由于某种原因,我无法将它们转换回希伯来语。

我在链接的评论中尝试了建议的解决方案。我也尝试使用 ''.join但它没有用。我得到的错误是:

Error Type: exceptions.UnicodeEncodeError 22:42:15 T:2806414192
M:2425589760 ERROR: Error Contents: 'ascii' codec can't encode
characters in position 0-4: ordinal not in range(128)



我试图用 unicode() 包裹东西但我得到的和上面的例子一样。

我如何做到这一点?

注:
我正在尝试解析 this link .

编辑:
我正在尝试使用 join 将列表转换为字符串然后打印出来。这是代码的相关图片:
soup = BeautifulStoneSoup(link, convertEntities=BeautifulStoneSoup.XML_ENTITIES)
programs = soup('ul')
for i,prog in enumerate(programs):
if i==(4+getLetterValue(name)):
j = 0
while j < len(prog('li')):
li = prog('li')[j]
link = li('a')[0]
url = link['href']
text = link.contents
print ''.join(text)
link是一个字符串。和 getLetterValue(name)返回一个整数,它告诉 html 文档中的位置。

最佳答案

这是一个 unicode string,它是希伯来语,你甚至可以直接在 Python 交互式 shell 上打印它。例如。:

>>> print u'\u05ea\u05d0\u05de\u05d9\u05df \u05dc\u05d9'
תאמין לי

如果出于某种原因确实需要将其转换为原始字节字符串( str 对象),则必须指定字节字符串的编码,因为文本可以用多种不同的编码表示。

简短回答:假设您想使用 UTF-8 对文本进行编码,您可以使用:
your_unicode_text.encode('utf-8')

如果您打算使用不同的编码,只需更改上面的编码名称。

有关 Python 如何处理 Unicode 文本和常见问题的引用,请参阅: http://docs.python.org/howto/unicode.html

另见 this answer有关 Unicode 和字符串编码的另一个简短说明。

关于python - 在python中将unicode字符列表转换为希伯来语字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7235081/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com