gpt4 book ai didi

c++ - 如何改进 Twitter 情绪分析器?

转载 作者:行者123 更新时间:2023-11-28 05:38:49 25 4
gpt4 key购买 nike

我正在开发 C++ Twitter 公司情绪分析工具。用户输入一家公司,该工具会分析一系列推文并返回情绪。

到目前为止,我做了以下事情:

  1. 将推文限制为英语和最近
  2. 小写
  3. 删除 RT、# 符号、@usernames 和 URL
  4. 删除 &^%$(){}... 等字符

然后我将推文解析为单词,并根据两个包含正面和负面单词的词典检查单词。我为每条推文创建总情绪。然后我计算正面、中性和负面推文的数量以得出最终答案。不使用权重。

我正在考虑实现以下两件事:

  1. 从推文中删除停用词
  2. 从推文中删除特殊字符和表情符号(基本上是非英语 Unicode)

然而,即便如此,大多数搜索最终还是非常中性的。例如,如果我在 100 条推文中搜索“Apple”,我会得到 30 条正面消息、10 条负面消息和 60 条中性消息。

问题:
1.有什么办法可以降低中性线?
2. 我应该添加什么样的正面和负面词来代表我的搜索条件(公司)

最佳答案

你说没有使用权重,但为什么不添加它。为每个 +/- 词分配 1 的基本权重,然后可能应用以下一些条件:

  1. 如果他们使用“非常”、“非常”等词,则加重以下形容词的权重(或者不加权重,将它们都算作一个 +/- 词)
  2. 与其将所有内容都更改为小写,不如将大写锁定用于使用乘数对这些单词进行加权的单词
  3. 对“fantastic”之类的词的评价比“good”之类的词更重

关于c++ - 如何改进 Twitter 情绪分析器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37622769/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com