gpt4 book ai didi

python - 计算文本中字典键的频率

转载 作者:行者123 更新时间:2023-11-28 19:40:28 24 4
gpt4 key购买 nike

我有一个字典。对于字典中的每个键,我想在一篇文章中找到它的频率。

打开文章后,我会做

for k, v in sourted_key.items():
for token in re.findall(k, data)
token[form] += 1

're.findall(k, data)' 中的键必须是字符串。但是这个字典中的键不是。我想搜索 key 。还有其他解决方案吗?请注意,KEYS 包含许多标点符号。

例如如果 key 是“手”。它只匹配手。不方便,钱德勒。

最佳答案

在 Python 2.7+ 中你可以使用 collections.Counter为此:

import re, collections

text = '''Nullam euismod magna et ipsum tristique suscipit. Aliquam ipsum libero, cursus et rutrum ut, suscipit id enim. Maecenas vel justo dolor. Integer id purus ante. Aliquam volutpat iaculis consectetur. Suspendisse justo sapien, tincidunt ut consequat eget, fringilla id sapien. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia Curae; Praesent mattis velit vitae libero luctus posuere. Vestibulum ac erat nibh, vel egestas enim. Ut ac eros ipsum, ut mattis justo. Praesent dignissim odio vitae nisl hendrerit sodales. In non felis leo, vehicula aliquam risus. Morbi condimentum nunc sit amet enim rutrum a gravida lacus pharetra. Ut eu nisi et magna hendrerit pharetra placerat vel turpis. Curabitur nec nunc et augue tristique semper.'''

c = collections.Counter(w.lower() for w in re.findall(r'\w+|[.,:;?!]', text))
words = set(('et', 'ipsum', ',', '?'))
for w in words:
print('%s: %d' % (w, c.get(w, 0)))

关于python - 计算文本中字典键的频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10501299/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com