gpt4 book ai didi

python - NLP 文本分类的步骤或方法?

转载 作者:行者123 更新时间:2023-11-30 22:43:27 24 4
gpt4 key购买 nike

我正在开发一个项目,根据情绪(正面或负面)对餐厅评论进行分类。另外我想对这些评论是否属于食品、服务、物有所值等类别进行分类。我无法链接互联网上提供的步骤或方法。谁能提供详细的方法或步骤来解决问题。

最佳答案

使用词袋模型怎么样。它已经经过了多年的尝试和测试。与更现代的方法相比,它有一些缺点,但您仍然可以获得不错的结果。互联网上有大量 Material 可以帮助您:

  • 将文档标准化为您的管道可摄取的形式
  • 将文档转换为向量并执行 TF-IDF 来过滤不相关的术语。 Here is a good tutorial 。并将它们转换为矢量形式。
  • 分割您的文档,获取一些文档子集,并根据评论的类别(情感)/类型标记属于训练数据的文档。显然,您的文档将属于两个类别。
  • 应用某种类型的降维技术使您的模型更加稳健,good discussion is here
  • 根据训练数据训练模型。您至少需要两种模型,一种用于情感,一种用于类型。有些算法仅适用于二进制类,因此您可能需要的不仅仅是评论类型(食品、值(value)、服务)的模型。这可能是一件好事,因为一条评论可以属于多个类别(食品质量和值(value),或值(value)和服务)。 Scikit-learn有很多好模型,我也强烈推荐orange toolbox它就像数据科学的 GUI。
  • 使用验证集验证您的模型。如果您的准确性令人满意(大多数经典方法(如 SVM)应该至少为 90%),请继续将其用于传入数据

关于python - NLP 文本分类的步骤或方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41764303/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com