- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想将句子分类为客观或主观。
例如:
目标:台北 101 是世界上最高的建筑。
主观:维纳斯·威廉姆斯是本十年最伟大的运动员。
我正在考虑使用朴素贝叶斯作为我的分类器。
我应该使用哪些数据进行训练?我正在考虑新闻文章和维基文章的客观句子。对于主观性,我考虑使用很多书籍(因为书籍往往更主观)。
这可能有效还是我的想法是错误的?我期望的准确度是多少?哪些数据最适合训练客观和主观?
最佳答案
最好的训练数据将是您真正要分类的同一类型的数据(来自同一来源)。如果您训练新闻文章标题(作为“客观”)和书籍句子(作为“主观”),那么您实际上正在学习一个模型来区分新闻文章标题和书籍句子。如果您随后使用此模型将推文(例如)分类为“主观”或“客观”,那么您不应期望获得良好的性能。
我建议您从实际数据类型中手动标记 1000 个句子,将其分类为“主观”或“客观”。这将为您提供相关且准确的训练数据,还可以让您了解您的数据和问题。然后从这 1000 个句子开始作为训练数据,并衡量您的表现。
关于machine-learning - 句子分类主观/客观,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29732638/
在我正在编写的应用程序中,我使用核心数据进行持久存储。我有一些与其他实体都相关的实体。我即将完成,现在即将为用户实现设置。顺便说一句,这些设置是应该并且将会在运行时更改的设置。因此,我没有使用设置包。
很抱歉问一个主观问题,但我欢迎一些建议。我是一位经验丰富的嵌入式软件程序员,但没有做过太多的网络编程,尽管我对 PHP 有一定的兴趣。 无论如何,我必须开发一个可能相当通用的应用程序类型,如这个粗略的
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题吗? 更新问题,以便 editing this post 提供事实和引用来回答它. 关闭 5 年前。 Improve
我是一名优秀的程序员,十分优秀!