gpt4 book ai didi

python - 在计数操作python中显示列表中的重复项

转载 作者:行者123 更新时间:2023-12-03 18:40:16 25 4
gpt4 key购买 nike

我有带有文本字符串的 corpus_text,然后我将其转换为带有单词拆分的列表

我需要计算所有单词,但我的算法只计算唯一的

corpus_test = 'cat dog tiger tiger tiger cat dog lion'
corpus_test = [[word.lower() for word in corpus_test.split()]]
word_counts = defaultdict(int)
for rowt in corpus_test:
for wordt in rowt:
word_counts[wordt] += 1

v_count = len(word_counts.keys())

words_list = list(word_counts.keys())

word_index = dict((word, i) for i, word in enumerate(words_list))

index_word = dict((i, word) for i, word in enumerate(words_list))

我想向你展示这个算法的输出
v_count
#4

words_list
#['cat', 'dog', 'tiger', 'lion']

word_counts
#defaultdict(int, {'cat': 2, 'dog': 2, 'tiger': 3, 'lion': 1})

word_index
#{'cat': 0, 'dog': 1, 'tiger': 2, 'lion': 3}

index_word
#{0: 'cat', 1: 'dog', 2: 'tiger', 3: 'lion'}

我需要:
index_word
#{0: 'cat', 1: 'dog', 2: 'tiger', 3: 'tiger', 4: 'tiger', 5: 'cat', 6: 'dog', 7:'lion'}


v_count
#8

最佳答案

用现有的算法,你可以试试这个。

index_word = dict((i, word) for i, word in enumerate(rowt)) 
v_count = len(index_word)

关于python - 在计数操作python中显示列表中的重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60869909/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com