gpt4 book ai didi

python - 如何使用文本分析来调查问卷回复?

转载 作者:太空狗 更新时间:2023-10-30 00:07:51 24 4
gpt4 key购买 nike

我是一个学生团队的“程序员”,该团队旨在调查我的文法学校的满意度和一般问题。我们有一个基于 1-6 等级的问题,我们通过我用 Python 编写的图表软件解释这些答案。

现在有一个 <textarea>在我们的问题的最后,人们可以随心所欲地使用。我目前正在考虑使这些数据可用的方法(我们不想阅读超过 800 个答案)。

我如何使用 Python 中的文本分析来调查学生写的内容?我正在考虑一种方法来“标记”任何写下的句子,例如:

I don't like being in school. [wellbeing][negative]
I have way too much homework. [homework][much]
I think there should be more interesting projects. [projects][more]

是否有任何可用的方法来获得它?使用现有的分词器有意义吗?

感谢您的帮助!

最佳答案

好吧,我只是在这里提出一些想法..但我能想到的一种方法是,

  1. 首先使用聚类算法对响应进行聚类。像 K-means 这样的东西或者您可以使用 LDA 之类的工具进行主题建模。

  2. 然后您可以通过文本分析使用您的标记方法在您从步骤 1 获得的每个集群/主题中生成频繁/相关的关键字。

为什么第 1 步是个好主意?好吧,在我看来——在进行文本分析时,如果你随意地给句子加标签,你可能会生成很多标签——其中很多标签在上下文中都是相似的。因此,您的可用性可能会下降,您仍然需要为每个句子分析大量标签。

使用聚类/主题建模也可以帮助将上下文问题减少到一定程度。因此,我认为更有用。

关于python - 如何使用文本分析来调查问卷回复?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13786635/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com