python - TextBlob 朴素贝叶斯。选择最高可能性-6ren

python - TextBlob 朴素贝叶斯。选择最高可能性

转载作者：行者123 更新时间：2023-11-30 09:19:58

作为训练数据，以 XML 形式对餐馆进行评论，并带有相关的目标表达、所表达的情感、所属的离散标签类别以及对此所表达的极性:

<text>With the great variety on the menu , I eat here often and never get bored .</text>
     <Opinions>
         <Opinion target="menu" category="FOOD#STYLE_OPTIONS" polarity="positive" from="30" to="34"/>
     </Opinions>

我使用 TextBlob NB 分类器将目标术语训练到关联类别。

对于测试数据，我的目标是在给定句子和类别的情况下预测目标表达。我首先从句子中提取了名词和名词短语，假设表达式是其中的子集。对于句子:

“最令人感兴趣的是该机构业主的最差服务态度”，这些是['服务态度', '业主', '机构'] 。

我想知道其中哪一个最有可能是给定的类别，在本例中是SERVICE#GENERAL。我该怎么办？

最佳答案

TextBlob 的 NB 分类器默认将文本特征提取为词袋。因此，您可以简单地将提取的名词列表中的单词连接起来，然后将其与类别连接起来，以将结果用作训练文本。并使用目标作为训练标签。

考虑到词袋独立对待单词，您应该仅用一个单词来转换这些名词短语。例如，您可以用“-”代替空格(“服务态度”将是“服务态度”)。

示例:

from textblob.classifiers import NaiveBayesClassifier

train = [('sevice-attitude owner establishment SERVICE#GENERAL', 'owner'),
         ('menu variety FOOD#STYLE_OPTIONS', 'menu')]

cl = NaiveBayesClassifier(train)

如果您愿意，可以自定义特征提取:https://textblob.readthedocs.io/en/dev/classifiers.html#feature-extractors

关于python - TextBlob 朴素贝叶斯。选择最高可能性，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43416645/

文章推荐： javascript - npm 编译错误 ('_' 未定义)

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - TextBlob 朴素贝叶斯。选择最高可能性