gpt4 book ai didi

machine-learning - CRF++/Wapiti 包括整个句子的类别作为特征

转载 作者:行者123 更新时间:2023-11-30 09:51:25 30 4
gpt4 key购买 nike

如何将朴素贝叶斯预测的句子类别表示为 CRF++ 或 Wapiti 中的特征?

例如,如果Tumblr merges with Yahoo.这个句子被分类为Business,那么在为crf编写训练文件时,我可以在哪里指明标签将业务作为一项功能?那么模板应该如何建模呢?

训练文件应该是这样的

Tumblr    business    ORG
merges business O
with business O
Yahoo business ORG

或者仅包含带有 ORG 标签的类别?为何如此?还有模板文件?

最佳答案

方法一:您可以采用与所示相同的方式将 business 添加为功能,也可以简单地编写 1 而不是 business。同样,对于类别sports,您可以添加另一列,对于属于sports 句子的单词,该列中的值应为1。您还必须分别在模板文件中添加每一列。

U42:%x[0,1] #for business
U43:%x[0,2] #for sports

方法2:将类别包含在 ORG 中可能不是一个好主意,因为相同的 ORG 可能会出现在不同的类别中。

关于machine-learning - CRF++/Wapiti 包括整个句子的类别作为特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44416634/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com