gpt4 book ai didi

python - 显示 unicode 和频率时出错

转载 作者:行者123 更新时间:2023-11-28 18:40:27 25 4
gpt4 key购买 nike

<分区>

我尝试使用 python 在包含 Unicode 文本的文件中查找单词的频率,输出为我的代码是

import codecs
file=codecs.open(r'C:\Users\Admin\Desktop\nepalii.txt', 'r', 'UTF-8')
nepalii = list(file.read().split())
from collections import Counter
count = Counter(nepalii)
print(count)

Counter({u'\u091b': 5, u'\u0915\u0947\u091f\u093e': 5, u'\u090f\u0915': 5, u'\u092e\u093e': 4, u'\u0938\u094d\u0915\u0941\u0932': 3, u'\u091f\u0947\u092c\u0941\u0932': 2, u'\u092f\u094b': 2, u'\u0917\u093f\u0924': 2, u'\u0939\u0930\u0941': 2, u'\u0915\u093f\u0924\u093e\u092c': 2, u'\u0939\u094b': 2, u'\u091b\u0928\u094d': 2, u'\u091a\u0909\u0930': 2, u'\u0917\u0908\u0930\u0939\u0947\u0915\u094b': 2, u'\u0930\u093e\u092e\u094d\u0930\u094b': 2, u'\u092c\u0938\u093f\u0930\u0939\u0947\u0915\u094b': 2, u'\u0915\u0947\u091f\u093f': 2, u'\u092e': 1, u'\u0939\u0941\u0928\u094d': 1, u'\u0909\u0928\u0940': 1, u'\u091c\u093e\u0928\u094d\u091b\u0941': 1, u'\u0917\u093e\u0908\u0930\u0939\u0947\u0915\u094b': 1, u'\u0916\u0947\u0932\u093f\u0930\u0939\u0947\u0915\u093e': 1, u'\ufeff\u092f\u094b': 1})

当我编辑代码时:

import codecs
file=codecs.open(r'C:\Users\Admin\Desktop\nepalii.txt', 'r', 'UTF-8')
nepalii = list(file.read().split())
from collections import Counter
count = Counter(nepalii)
print u'[{}]'.format(u', '.join(count))

输出是:

[टेबुल, यो, गित, हरु, छ, किताब, हो, छन्, चउर, गईरहेको, म, राम्रो, मा, केटा, हुन्, बसिरहेको, उनी, एक, केटि, जान्छु, स्कुल, गाईरहेको, खेलिरहेका, यो]

这里不显示频率。

我期望的输出是:

[टेबुल:3, यो:4, गित:9, हरु:3,.....................]

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com