ai didi

python - 波兰编码 - 分割问题

转载 作者:行者123 更新时间:2023-12-01 03:04:17 24 4
gpt4 key购买 nike

我有一个使用波兰语字符以 utf-8 编码的文件。我需要做的就是玩一点文字游戏。但是当我使用 split("") 列表包含\xc5\x82 或\u0142

filename = 'patient.txt'
f = open(filename, 'r')
for line in f:
print line
print line.split(" ")
print unicode(line,encoding(line),errors='ignore').split(" ")
f.close()

结果:

   Pacjent lat 48 został przyjęty do Oddziału z powodu spadku tolerancji wysiłku i duszności.
['\xef\xbb\xbfPacjent', 'lat', '48', 'zosta\xc5\x82', 'przyj\xc4\x99ty', 'do', 'Oddzia\xc5\x82u', 'z', 'powodu', 'spadku', 'tolerancji', 'wysi\xc5\x82ku', 'i', 'duszno\xc5\x9bci.']
[u'Pacjent', u'lat', u'48', u'zosta\u0142', u'przyj\u0119ty', u'do', u'Oddzia\u0142u', u'z', u'powodu', u'spadku', u'tolerancji', u'wysi\u0142ku', u'i', u'duszno\u015bci.']

我需要做什么才能在列表中包含波兰语字符?有可能吗?

问候
帕维尔

最佳答案

列表中已有波兰语字符。但是当您打印列表时,您只能看到其表示形式。

>>> print u'zosta\u0142'
został

关于python - 波兰编码 - 分割问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43559974/

24 4 0
文章推荐: python re匹配字符串中的下划线或连字符
文章推荐: javascript - 如何在javascript中添加一张又一张的图片
文章推荐: javascript - 如何将内容包含到ajax成功代码中?
文章推荐: javascript - 使用tickformat在绘图中格式化轴刻度中的文本
行者123
个人简介

我是一名优秀的程序员,十分优秀!

滴滴打车优惠券免费领取
滴滴打车优惠券
全站热门文章
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com