- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我希望将分数(正面、负面或中性)应用于文本短语。由于无法解析表情符号并根据其用法做出假设,我不确定还可以尝试什么。谁能提供对这个问题进行更多词法分析的示例、研究论文、文章等。
我认为副词的使用、标点符号的误用/重复、拼写/语法错误都可以在几乎二元的意义上(好或坏)作为作者情绪的良好指标。
最佳答案
这听起来像是一个非常清晰的二元分类任务,您可以将问题简化为正或负,然后通过将概率质量设置为中性来做出最具熵的决策或尚未达到确定性阈值的决策。
您最大的障碍将是获取随机机器学习方法的训练数据。您可以使用现成的最大熵模型轻松地做到这一点,例如 Toolkit for Advanced Discriminative Modeling或Mallet 。您描述的功能只需格式化为这些模型使用的输入。
为了获得训练数据,您可以进行某种付费众包,例如亚马逊的 Mechanical Turk,或者自己动手,也许可以在 friend 的帮助下进行。为此,您需要大量数据。鉴于数据缺乏,您可以通过主动学习、集成或增强等方法来提高模型的预测强度,但重要的是尽可能根据现实世界的数据来测试这些方法,并选择最有效的方法。实际应用。
如果您正在寻找这方面的论文,您需要查看 Google 学术搜索中的术语“情感分析”。 The Association for Computational Linguistics有许多来自 session 和期刊的免费且有用的论文,这些论文从语言和算法的角度解决了该问题。我也会浏览他们的文件。祝你好运!
关于parsing - 通过词法分析确定文本短语的 "Mood",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/996853/
我希望将分数(正面、负面或中性)应用于文本短语。由于无法解析表情符号并根据其用法做出假设,我不确定还可以尝试什么。谁能提供对这个问题进行更多词法分析的示例、研究论文、文章等。 我认为副词的使用、标点符
我可以为两个样本 t 检验做,但不能用于中值检验或 Wilcoxon 检验或 Hodges Lehmann 检验 data_2000 = 49.57143) + sum(null_dist delt
这个问题在这里已经有了答案: Count the number of occurrences of a character in a string (26 个答案) 关闭 4 年前。 在 pytho
我是一名优秀的程序员,十分优秀!