作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
With your perfect help here我已经了解了如何计算热门话题(标准分数 + float 平均值)。
我的下一个问题:我的数据库中的术语(由 1-3 个单词组成)与它们被提及的时间相关联。但热门话题总是只有 1 个单词的术语,因为一个术语的一部分总是比完整的术语更频繁地被提及。示例:昨天有 3 篇新闻文章是关于“巴拉克·奥巴马”的,今天有 148 篇。然后“巴拉克·奥巴马”当然正在上升。但“巴拉克”也在崛起,因此成为热门话题。
在计算热门话题时如何包含术语长度?我不想使用其他算法,我对上面的算法非常满意。我可以将所有两个词项的分数乘以 1.5 左右吗?
详细示例:我的主要趋势是:微软、中国、希拉里·克林顿、达拉斯小牛队。我想说“希拉里·克林顿”和“达拉斯小牛队”从来没有排名第一或第二,因为它们是两个词。 “微软”和“中国”是一个词,所以总是排名靠前。有没有可能解决这个问题?
我希望你能帮助我。提前致谢!
最佳答案
谈到奥巴马,是的,你可以。 :)
也许您可以在输出之前测试您的高趋势是否包含在低趋势中。我会尝试这样的事情:
示例:你有
关于tags - 热门话题 : 1-word terms vs composed terms,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/939938/
放弃当前在 Mercurial topic 中不需要的变更集的最佳方法是什么,这些变更集已经被推送并且不能被剥离? 换句话说,是否可以从 hg topics 输出中删除主题而不发布它? 最佳答案 hg
我是一名优秀的程序员,十分优秀!