gpt4 book ai didi

nlp - 情绪分析的最佳算法方法

转载 作者:行者123 更新时间:2023-12-03 10:24:14 26 4
gpt4 key购买 nike

关闭。这个问题是opinion-based .它目前不接受答案。












想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题.

7年前关闭。




Improve this question




我的要求是接收新闻文章并确定它们对某个主题是正面还是负面。我正在采用下面概述的方法,但我一直在阅读 NLP 可能在这里有用。我所读到的所有内容都指向 NLP 从事实中检测意见,我认为这对我来说并不重要。我想知道两件事:

1) 为什么我的算法不起作用和/或我如何改进它? (我知道讽刺可能是一个陷阱,但我再次认为在我们将获得的新闻类型中不会发生太多)

2) NLP 有什么帮助,我为什么要使用它?

我的算法方法(我有正面、负面和否定词的字典):

1) 统计文章中正负词的个数

2) 如果发现否定词有 2 或 3 个肯定词或否定词,(即:不是最好的)否定分数。

3)将分数乘以手动分配给每个单词的权重。 (1.0 开始)

4) 将正面和负面的总数相加得到情绪分数。

最佳答案

我认为没有什么特别的错误 使用您的算法,这是一种相当直接且实用的方法,但是在很多情况下它会出错。

  • 暧昧情话 - “这个产品非常好用”与“这个产品非常好”
  • 错过的否定 - “我永远不会在一百万年内说这个产品值得购买”
  • 引用/间接文本 - “我爸爸说这个产品很糟糕,但我不同意”
  • 比较 - “这个产品和头上的一个洞一样有用”
  • 任何细微之处 - “该产品丑陋、缓慢且乏味,但它是市场上唯一能胜任这项工作的产品”

  • 我使用产品评论作为例子而不是新闻报道,但你明白了。事实上,新闻文章可能更难,因为它们经常试图展示论点的双方,并倾向于使用某种风格来传达一个观点。例如,最后一个例子在观点文章中很常见。

    至于 NLP 可以帮助您解决任何问题, word sense disambiguation (甚至只是 part-of-speech tagging )可能有助于 (1), syntactic parsing可能有助于解决(2)中的长期依赖关系,某种 chunking可能有助于(3)。不过,这都是研究级别的工作,我不知道您可以直接使用什么。问题 (4) 和 (5) 更难,我举手并在这一点上放弃。

    我会坚持你的方法并仔细查看输出,看看它是否在做你想要的。当然,这会引发一个问题,即您希望您首先理解“情绪”的定义......

    关于nlp - 情绪分析的最佳算法方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4199441/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com