gpt4 book ai didi

machine-learning - 句子分类主观/客观

转载 作者:行者123 更新时间:2023-11-30 09:29:50 27 4
gpt4 key购买 nike

我想将句子分类为客观或主观。

例如:

目标:台北 101 是世界上最高的建筑。

主观:维纳斯·威廉姆斯是本十年最伟大的运动员。

我正在考虑使用朴素贝叶斯作为我的分类器。

我应该使用哪些数据进行训练?我正在考虑新闻文章和维基文章的客观句子。对于主观性,我考虑使用很多书籍(因为书籍往往更主观)。

这可能有效还是我的想法是错误的?我期望的准确度是多少?哪些数据最适合训练客观和主观?

最佳答案

最好的训练数据将是您真正要分类的同一类型的数据(来自同一来源)。如果您训练新闻文章标题(作为“客观”)和书籍句子(作为“主观”),那么您实际上正在学习一个模型来区分新闻文章标题和书籍句子。如果您随后使用此模型将推文(例如)分类为“主观”或“客观”,那么您不应期望获得良好的性能。

我建议您从实际数据类型中手动标记 1000 个句子,将其分类为“主观”或“客观”。这将为您提供相关且准确的训练数据,还可以让您了解您的数据和问题。然后从这 1000 个句子开始作为训练数据,并衡量您的表现。

关于machine-learning - 句子分类主观/客观,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29732638/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com