gpt4 book ai didi

python - 关于情绪分析的问题

转载 作者:太空宇宙 更新时间:2023-11-03 12:42:18 25 4
gpt4 key购买 nike

我有一个关于情绪分析的问题需要帮助。

现在,我有一堆通过 Twitter 搜索 API 收集的推文。因为我使用了搜索词,所以我知道我想查看的主题或实体(人名)是什么。我想知道其他人对这些人的看法。

首先,我下载了一个具有已知效价/情感分数的英语单词列表,并根据这些单词在推文中的可用性计算情感 (+/-)。问题是情绪是这样计算的——我实际上更多地关注推文的语气,而不是关于这个人。

例如,我有这条推文:

"lol... Person A is a joke. lmao!"

消息显然是正面的,但是 A 应该得到负面的。

为了改进我的情绪分析,我或许可以从我的单词列表中考虑否定和修饰语。但是,我究竟如何才能让我的情绪分析来查看消息的主题(可能还有讽刺)呢?

如果有人可以指导我获取一些资源,那就太好了......

最佳答案

在等待 AI 领域的研究人员给出答案的同时,我将为您提供一些线索,告诉您可以快速做什么。

尽管该主题需要自然语言处理、机器学习甚至心理学方面的知识,但您不必从头开始,除非您绝望或对该领域正在进行的研究的质量不信任。

情感分析的一种可能方法是将其视为监督学习问题,其中您有一些小型训练语料库,其中包括人工注释(稍后介绍)和测试语料库,您可以在该语料库上测试您的处理方式/系统正在执行。对于训练,您将需要一些分类器,如 SVM、HMM 或其他一些,但要保持简单。我会从二元分类开始:好,坏。您可以对连续的意见范围(从正面到负面)执行相同的操作,即获得排名,如谷歌,其中最有值(value)的结果排在最前面。

开始检查libsvm classifier ,它能够进行分类{好,坏}和回归(排名)。注释的质量将对您获得的结果产生巨大影响,但从哪里获得呢?

我找到了 one project about sentiment analysis与餐馆打交道。既有数据又有代码,所以你可以看到他们如何从自然语言中提取特征,以及哪些特征在分类或回归中得分高。该语料库包含顾客对他们最近访问过的餐厅的意见,并给出了一些关于食物、服务或氛围的反馈。他们的观点与数字世界的联系以他们给餐厅的星级数来表示。您在一个网站上使用自然语言,在另一个网站上使用餐厅价格。

查看此示例,您可以针对所述问题设计自己的方法。看看nltk以及。使用 nltk,您可以进行词性标注,运气好的话还可以获取名称。完成后,您可以向分类器添加一个功能,如果在 n 个单词(跳过 n-gram)中有表达意见的单词(查看餐厅语料库)或使用您已经拥有的权重,则会为名称分配分数,但它是最好依靠分类器来学习权重,这是他的工作。

关于python - 关于情绪分析的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5741135/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com