- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我是一个学生团队的“程序员”,该团队旨在调查我的文法学校的满意度和一般问题。我们有一个基于 1-6 等级的问题,我们通过我用 Python 编写的图表软件解释这些答案。
现在有一个 <textarea>
在我们的问题的最后,人们可以随心所欲地使用。我目前正在考虑使这些数据可用的方法(我们不想阅读超过 800 个答案)。
我如何使用 Python 中的文本分析来调查学生写的内容?我正在考虑一种方法来“标记”任何写下的句子,例如:
I don't like being in school. [wellbeing][negative]
I have way too much homework. [homework][much]
I think there should be more interesting projects. [projects][more]
是否有任何可用的方法来获得它?使用现有的分词器有意义吗?
感谢您的帮助!
最佳答案
好吧,我只是在这里提出一些想法..但我能想到的一种方法是,
首先使用聚类算法对响应进行聚类。像 K-means 这样的东西或者您可以使用 LDA 之类的工具进行主题建模。
然后您可以通过文本分析使用您的标记方法在您从步骤 1 获得的每个集群/主题中生成频繁/相关的关键字。
为什么第 1 步是个好主意?好吧,在我看来——在进行文本分析时,如果你随意地给句子加标签,你可能会生成很多标签——其中很多标签在上下文中都是相似的。因此,您的可用性可能会下降,您仍然需要为每个句子分析大量标签。
使用聚类/主题建模也可以帮助将上下文问题减少到一定程度。因此,我认为更有用。
关于python - 如何使用文本分析来调查问卷回复?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13786635/
我正在制作一个包含抑郁症测试的 Android 应用程序。测试包括 9 个问题,每个问题有 4 个可能的答案。答案以单选按钮的形式出现。我需要按如下方式为单选按钮分配数值: 答案 1 = 0 答案 2
我希望在我的 Intranet 上创建一个问卷,通过一次只显示一个“部分”来简化用户的操作,并允许用户在表单中前进和后退。 我没有描述我的想法,而是制作了一个小 GIF 在我盲目地陷入困境之前,我真的
我们有一个系统,公民从服务器下载问卷,填写并提交问卷回复到服务器,存储在那里。在我们的案例中,这些是关于您的感受和症状的简单问题。然后,卫生 worker 可以访问问卷答复。卫生 worker 要的不
我正在尝试创建一个简单的 GUI,它会询问用户一系列问题,然后存储他们的回答以供稍后分配。我已经确定我的错误出在我的方法中,该方法基本上执行了简单的 7 个问题。我已将 7 个问题添加到 ArrayL
Django-survey 或 django-questionnaire 对我来说过于以管理员为中心(除了与 django 相关)。我希望我的用户创建他们自己的调查。类似于 Google 表单调查(查
第一次在论坛发帖。我遵循了所有提示,并在发布查询之前寻找可能的答案,但我找不到一步的答案,我陷入了困境。我不是程序员。我是一名教育技术专家,主要从事 Moodle 工作。我在 PHP 中创建了一些 b
我是一名优秀的程序员,十分优秀!