gpt4 book ai didi

用于情感分析的 Python VADER 词典结构

转载 作者:行者123 更新时间:2023-11-28 20:58:54 40 4
gpt4 key购买 nike

我正在使用 Python 的 nltk 库中的 VADER 情感词典来分析文本情感。这个词典不太适合我的领域,所以我想给各种词加上我自己的情感分数。所以,我得到了词典文本文件 (vader_lexicon.txt) 来做到这一点。但是,我不太了解此文件的体系结构。例如,像 obliterate 这样的词将在文本文件中具有以下数据: 抹杀 -2.9 0.83066 [-3, -4, -3, -3, -3, -3, -2, -1, -4, -3]

显然,-2.9 是列表中情绪分数的平均值。但是 0.83066 代表什么?

谢谢!

最佳答案

根据VADER source code , 仅使用每行的第一个数字。该行的其余部分将被忽略:

for line in self.lexicon_full_filepath.split('\n'):
(word, measure) = line.strip().split('\t')[0:2] # Here!
lex_dict[word] = float(measure)

关于用于情感分析的 Python VADER 词典结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50882838/

40 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com