作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
作为训练数据,以 XML 形式对餐馆进行评论,并带有相关的目标表达、所表达的情感、所属的离散标签类别以及对此所表达的极性:
<text>With the great variety on the menu , I eat here often and never get bored .</text>
<Opinions>
<Opinion target="menu" category="FOOD#STYLE_OPTIONS" polarity="positive" from="30" to="34"/>
</Opinions>
我使用 TextBlob NB 分类器将目标术语训练到关联类别。
对于测试数据,我的目标是在给定句子和类别的情况下预测目标表达。我首先从句子中提取了名词和名词短语,假设表达式是其中的子集。对于句子:
“最令人感兴趣的是该机构业主的最差服务态度
”,这些是['服务态度', '业主', '机构']
。
我想知道其中哪一个最有可能是给定的类别,在本例中是SERVICE#GENERAL
。我该怎么办?
最佳答案
TextBlob 的 NB 分类器默认将文本特征提取为词袋。因此,您可以简单地将提取的名词列表中的单词连接起来,然后将其与类别连接起来,以将结果用作训练文本。并使用目标作为训练标签。
考虑到词袋独立对待单词,您应该仅用一个单词来转换这些名词短语。例如,您可以用“-”代替空格(“服务态度”将是“服务态度”)。
示例:
from textblob.classifiers import NaiveBayesClassifier
train = [('sevice-attitude owner establishment SERVICE#GENERAL', 'owner'),
('menu variety FOOD#STYLE_OPTIONS', 'menu')]
cl = NaiveBayesClassifier(train)
如果您愿意,可以自定义特征提取:https://textblob.readthedocs.io/en/dev/classifiers.html#feature-extractors
关于python - TextBlob 朴素贝叶斯。选择最高可能性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43416645/
我是一名优秀的程序员,十分优秀!