gpt4 book ai didi

python - 字符串中的奇怪字符

转载 作者:行者123 更新时间:2023-11-28 20:22:24 25 4
gpt4 key购买 nike

我正在从文件中读取一些数据..

但是我观察到一些奇怪的字符;

'tamb\xc3\xa9m', 'f\xc3\xbcr','cari\xc3\xb1o'

我的文件读取代码相当标准:

 with open(filename) as f:
for line in f:
print line

最佳答案

您有 UTF-8 编码的数据。你可以解码数据:

with open(filename) as f:
for line in f:
print line.decode('utf8')

或使用 io.open()让 Python 在您阅读时为您解码内容:

import io

with io.open(filename, encoding='utf8') as f:
for line in f:
print line

你的数据,已解码:

>>> print 'tamb\xc3\xa9m'.decode('utf8')
também
>>> print 'f\xc3\xbcr'.decode('utf8')
für
>>> print 'cari\xc3\xb1o'.decode('utf8')
cariño

您似乎打印了字符串 representations(repr() 函数的输出),它生成适合粘贴回 Python 解释器的字符串文字语法。 \xhh 十六进制代码用于可打印 ASCII 范围之外的字符。 listdict 等 Python 容器也使用 repr() 在打印时显示其内容。

您可能想阅读有关 Unicode 的内容,以及它如何与 Python 交互。见:

关于python - 字符串中的奇怪字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23919128/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com