gpt4 book ai didi

data-analysis - 使用机器学习算法对 python 中的推文进行情感分析

转载 作者:行者123 更新时间:2023-12-04 02:53:52 27 4
gpt4 key购买 nike

假设我下载了“n”条推文并从中删除了长度 <= 2 的单词,然后将每条推文标记为“负面”或“非负面”,这样就形成了我的训练集。

但是在我的数据集中,没有像 Iris 数据集如何具有萼片长度、萼片宽度、花瓣长度和花瓣宽度那样定义明确的属性,只是每个词都变成了一个属性,不同的示例推文将有不同数量的属性。

我可以使用这个数据集并将我的问题视为分类问题吗?并尝试预测一条新推文是负面的还是非负面的?

或者您认为预测推文是否负面的最佳方法是什么?

最佳答案

您描述的是标准文本分类问题。在此设置中,特征集是一组(有限的)单词而不是萼片长度、宽度、...

因此,每个文档都根据所有此类特征进行表示(所有文档都具有相同数量的特征),但大多数值将为零,从而创建一个非常稀疏的向量。

这是预测极性/情绪的最佳方法,但您应该进一步提高对该主题的了解。我建议阅读 Sebastiani's survey on Text Classification .

问候,

关于data-analysis - 使用机器学习算法对 python 中的推文进行情感分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17083821/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com