- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个 Google 表单,我正在使用它来收集调查数据(对于这个问题,我将使用 example form ),其中包含可以有多个答案的问题,使用一组复选框进行选择。
当我从表单中获取数据并将其导入 pandas 时,我得到了这个:
Timestamp What sweets do you like?
0 23/11/2013 13:22:30 Chocolate, Toffee, Popcorn
1 23/11/2013 13:22:34 Chocolate
2 23/11/2013 13:22:39 Toffee, Popcorn, Fruit
3 23/11/2013 13:22:45 Fudge, Toffee
4 23/11/2013 13:22:48 Popcorn
我想对问题的结果进行统计(有多少人喜欢巧克力,有多少人喜欢太妃糖等)。问题是,所有答案都在一列中,因此按该列分组并询问计数是行不通的。
Pandas 中是否有一种简单的方法可以将这种数据框转换成一个包含多列的数据框,分别称为 Chocolate、Toffee、Popcorn、Fudge 和 Fruit,其中每一列都是 bool 值(1 表示是,0 表示否) ?我想不出一个明智的方法来做到这一点,我不确定它是否真的有帮助(以这种方式进行我想做的聚合可能会更难)。
最佳答案
几天前我遇到了同样的问题,经过一番搜索,我找到了str.get_dummies
在 Pandas 文档中的功能。让我们看看它是如何工作的:
如文档中所述,str.get_dummies
按 sep 拆分 Series 中的每个字符串并返回虚拟/指标变量的 DataFrame。
这是上述 DataFrame 的简化版本:
In [27]: df
Out[27]:
What sweets do you like?
0 Chocolate, Toffee, Popcorn
1 Chocolate
2 Toffee, Popcorn, Fruit
3 Fudge, Toffee
4 Popcorn
我们需要在 str.get_dummies
中指定的唯一参数是 sep,在我们的例子中是逗号:
In [28]: df['What sweets do you like?'].str.get_dummies(sep=', ')
Out[28]:
Chocolate Fruit Fudge Popcorn Toffee
0 1 0 0 1 1
1 1 0 0 0 0
2 0 1 0 1 1
3 0 0 1 0 1
4 0 0 0 1 0
注意 sep 参数中逗号后有一个空格,因为空格本身就是一个字符,如果我们不将其包含在 sep 中,结果将是类似下面的内容显然是错误的:
In [29]: df['What sweets do you like?'].str.get_dummies(sep=',')
Out[29]:
Fruit Popcorn Toffee Chocolate Fudge Popcorn Toffee
0 0 1 1 1 0 0 0
1 0 0 0 1 0 0 0
2 1 1 0 0 0 0 1
3 0 0 1 0 1 0 0
4 0 0 0 0 0 1 0
根据经验,始终注意准确书写分隔符!
关于python - 使用 pandas 处理多选问卷(来自 Google Forms)结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20162926/
我正在制作一个包含抑郁症测试的 Android 应用程序。测试包括 9 个问题,每个问题有 4 个可能的答案。答案以单选按钮的形式出现。我需要按如下方式为单选按钮分配数值: 答案 1 = 0 答案 2
我希望在我的 Intranet 上创建一个问卷,通过一次只显示一个“部分”来简化用户的操作,并允许用户在表单中前进和后退。 我没有描述我的想法,而是制作了一个小 GIF 在我盲目地陷入困境之前,我真的
我们有一个系统,公民从服务器下载问卷,填写并提交问卷回复到服务器,存储在那里。在我们的案例中,这些是关于您的感受和症状的简单问题。然后,卫生 worker 可以访问问卷答复。卫生 worker 要的不
我正在尝试创建一个简单的 GUI,它会询问用户一系列问题,然后存储他们的回答以供稍后分配。我已经确定我的错误出在我的方法中,该方法基本上执行了简单的 7 个问题。我已将 7 个问题添加到 ArrayL
Django-survey 或 django-questionnaire 对我来说过于以管理员为中心(除了与 django 相关)。我希望我的用户创建他们自己的调查。类似于 Google 表单调查(查
第一次在论坛发帖。我遵循了所有提示,并在发布查询之前寻找可能的答案,但我找不到一步的答案,我陷入了困境。我不是程序员。我是一名教育技术专家,主要从事 Moodle 工作。我在 PHP 中创建了一些 b
我是一名优秀的程序员,十分优秀!