gpt4 book ai didi

python - TextBlob 朴素贝叶斯。选择最高可能性

转载 作者:行者123 更新时间:2023-11-30 09:19:58 25 4
gpt4 key购买 nike

作为训练数据,以 XML 形式对餐馆进行评论,并带有相关的目标表达、所表达的情感、所属的离散标签类别以及对此所表达的极性:

<text>With the great variety on the menu , I eat here often and never get bored .</text>
<Opinions>
<Opinion target="menu" category="FOOD#STYLE_OPTIONS" polarity="positive" from="30" to="34"/>
</Opinions>

我使用 TextBlob NB 分类器将目标术语训练到关联类别。

对于测试数据,我的目标是在给定句子和类别的情况下预测目标表达。我首先从句子中提取了名词和名词短语,假设表达式是其中的子集。对于句子:

“最令人感兴趣的是该机构业主的最差服务态度”,这些是['服务态度', '业主', '机构']

我想知道其中哪一个最有可能是给定的类别,在本例中是SERVICE#GENERAL。我该怎么办?

最佳答案

TextBlob 的 NB 分类器默认将文本特征提取为词袋。因此,您可以简单地将提取的名词列表中的单词连接起来,然后将其与类别连接起来,以将结果用作训练文本。并使用目标作为训练标签。

考虑到词袋独立对待单词,您应该仅用一个单词来转换这些名词短语。例如,您可以用“-”代替空格(“服务态度”将是“服务态度”)。

示例:

from textblob.classifiers import NaiveBayesClassifier

train = [('sevice-attitude owner establishment SERVICE#GENERAL', 'owner'),
('menu variety FOOD#STYLE_OPTIONS', 'menu')]

cl = NaiveBayesClassifier(train)

如果您愿意,可以自定义特征提取:https://textblob.readthedocs.io/en/dev/classifiers.html#feature-extractors

关于python - TextBlob 朴素贝叶斯。选择最高可能性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43416645/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com