作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
像谷歌新闻这样的新闻媒体如何自动对关于新兴主题的文档进行分类和排名,比如“奥巴马的 2011 年预算”?
我有一堆用棒球数据标记的文章,比如球员姓名和文章的相关性(谢谢,opencalais),我很想创建一个谷歌新闻风格的界面,在新帖子进来时进行排名和显示,尤其是新兴的帖子话题。我想可以用一些静态类别训练朴素贝叶斯分类器,但这并不能真正跟踪趋势,例如“这名球员刚刚被交易到这支球队,其他球员也参与其中。”
最佳答案
毫无疑问,Google 新闻可能会使用其他技巧(甚至是它们的组合),但一种相对便宜的技巧,在计算上,从自由文本中推断主题将利用 NLP 概念 一个词只有在连接到其他词时才有意义 .
可以从多个文档中发现新主题类别的算法可以概括如下:
关于statistics - 盲目地对传入数据中的新趋势进行分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2180915/
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我是一名优秀的程序员,十分优秀!