- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我对 Python 和 Pandas 还很陌生,所以请耐心等待......
我有一个沉船乘客的数据框。我已将其按男性和女性以及类别分解为其他数据框,以创建生存概率。我创建了一个函数,将一个数据帧与仅包含幸存者的数据帧进行比较,并计算该组中的生存概率:
def survivability(total_pass_df, column, value):
survivors = sum(did_survive[column] == value)
total = len(total_pass_df)
survival_prob = round((survivors / total), 2)
return survival_prob
但现在我正在尝试比较较小群体的生存能力 - 例如,男性头等舱乘客与女性三等舱乘客。我确实为这两个组制作了数据框,但我仍然无法使用我的生存功能,因为我正在比较两个不同的列 - 性别和类(Class) - 而不仅仅是一个。
我确切地知道如何使用 Python 来做到这一点 - 循环遍历数据框中的“幸存”列(即 1 或 0),如果它等于 1,则将索引值加 1,然后一旦所有数据都经过,将索引值除以数据帧的长度以获得生存概率......
但是我应该使用 Pandas 来实现这一点,但我无法在脑海中计算出如何做到这一点......
:/
最佳答案
如果没有您正在使用的数据帧的示例,我无法确定我是否正确理解您的问题。但根据你对纯Python过程的描述,
I know exactly how I'd do it with Python - loop through the 'survived' column (which is either a 1 or 0), in the dataframe, if it equals 1, then add one to an index value, and once all the data has been gone through, divide the index value by the length of the dataframe to get the probability of survival....
你可以在 Pandas 中通过简单的编写来做到这一点
dataframe['survived'].mean()
就是这样。假定所有值不是 1 就是 0,平均值就是 1 的数量除以总行数。
如果您从一个包含 survived
、sex
、class
等列的数据框开始,您可以优雅地组合这是通过 Pandas 的 bool 索引来选择不同群体的生存率。让我使用Socialcops Titanic passengers data set为例进行演示。假设DataFrame
名为df
,如果你只想分析男性乘客,你可以得到这些记录:
df[df['sex'] == 'male']
然后您可以获取 that 的 survived
列并获取平均值。
>>> df[df['sex'] == 'male']['survived'].mean()
0.19198457888493475
因此,19% 的男性乘客幸存。如果您想缩小范围为男性二等舱乘客,则需要使用 &
组合条件,如下所示:
>>> df[(df['sex'] == 'male') & (df['pclass'] == 2)]['survived'].mean()
0.14619883040935672
这有点笨拙,但有一种更简单的方法实际上可以让您同时执行多个类别。 (问题是,这是一种更先进的 Pandas 技术,可能需要一段时间才能理解它。)使用 DataFrame.groupby()
方法,您可以告诉 Pandas 根据某些列中的值对数据框的行进行分组。例如,
df.groupby('sex')
告诉 Pandas 按性别对行进行分组:所有男性乘客的记录都在一组中,所有女性乘客的记录都在另一组中。您从groupby()
获得的东西不是DataFrame
,它是一种特殊类型的对象,可让您应用聚合函数 - 即采用整个组和把它变成一个数字(或其他东西)。因此,例如,如果您这样做
>>> df.groupby('sex').mean()
pclass survived age sibsp parch fare \
sex
female 2.154506 0.727468 28.687071 0.652361 0.633047 46.198097
male 2.372479 0.190985 30.585233 0.413998 0.247924 26.154601
body
sex
female 166.62500
male 160.39823
您会看到,对于每一列,Pandas 取该列所有值的男性乘客记录以及所有女性乘客记录的平均值。您在这里关心的只是生存率,所以只需使用
>>> df.groupby('sex').mean()['survived']
sex
female 0.727468
male 0.190985
这样做的一大优点是,如果您想查看小组,您可以提供多个列作为分组依据。例如,性别和类(Class):
>>> df.groupby(['sex', 'pclass']).mean()['survived']
sex pclass
female 1 0.965278
2 0.886792
3 0.490741
male 1 0.340782
2 0.146199
3 0.152130
(如果您提供多个列名称,则必须为 groupby
提供一个列名称列表)
关于python - 根据 Pandas 数据框中的多个变量计算概率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41531930/
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: How to nest OR statements in JavaScript? 有没有办法做到这一点:
在 JavaScript 中有没有办法让一个变量总是等于一个变量?喜欢var1 = var2但是当var2更新,也是var1 . 例子 var var1 = document.getElementBy
我正在努力理解这代表什么 var1 = var2 == var3 我的猜测是这等同于: if (var2 == var3): var1 = var2 最佳答案 赋值 var1 = var2
这个问题已经有答案了: What does the PHP error message "Notice: Use of undefined constant" mean? (2 个回答) 已关闭 8
我在临时表中有几条记录,我想从每条记录中获取一个值并将其添加到一个变量中,例如 color | caption -------------------------------- re
如何将字符串转为变量(字符串变量--> $variable)? 或者用逗号分隔的变量列表然后转换为实际变量。 我有 2 个文件: 列名文件 行文件 我需要根据字符串匹配行文件中的整行,并根据列名文件命
我有一个我无法解决的基本 php 问题,我也想了解为什么! $upperValueCB = 10; $passNodeMatrixSource = 'CB'; $topValue= '$uppe
这可能吗? php $variable = $variable1 || $variable2? 如果 $variable1 为空则使用 $variable2 是否存在类似的东西? 最佳答案 PHP 5
在 Perl 5.20 中,for 循环似乎能够修改模块作用域的变量,但不能修改父作用域中的词法变量。 #!/usr/bin/env perl use strict; use warnings; ou
为什么这不起作用: var variable; variable = variable.concat(variable2); $('#lunk').append(variable) 我无法弄清楚这一点
根据我的理解,在32位机器上,指针的sizeof是32位(4字节),而在64位机器上,它是8字节。无论它们指向什么数据类型,它们都有固定的大小。我的计算机在 64 位上运行,但是当我打印包含 * 的大
例如: int a = 10; a += 1.5; 这运行得很完美,但是 a = a+1.5; 此作业表示类型不匹配:无法从 double 转换为 int。所以我的问题是:+= 运算符 和= 运算符
您好,我写了这个 MySQL 存储过程,但我一直收到这个语法错误 #1064 - You have an error in your SQL syntax; check the manual that
我试图在我的场景中显示特定的奖牌,这取决于你的高分是基于关卡的目标。 // Get Medal Colour if levelHighscore goalScore { sc
我必须维护相当古老的 Visual C++ 源代码的大型代码库。我发现代码如下: bIsOk = !!m_ptr->isOpen(some Parameters) bIsOk的数据类型是bool,is
我有一个从 MySQL 数据库中提取的动态产品列表。在 list 上有一个立即联系 按钮,我正在使用一个 jquery Modal 脚本,它会弹出一个表单。 我的问题是尝试将产品信息变量传递给该弹出窗
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: What is the difference between (type)value and type(va
jQuery Core Style Guidelines建议两种不同的方法来检查变量是否已定义。 全局变量:typeof variable === "undefined" 局部变量:variable
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicate: “Variable” Variables in Javascript? 我想肯定有一种方法可以在 JavaScrip
在语句中使用多重赋值有什么优点或缺点吗?在简单的例子中 var1 = var2 = true; 赋值是从右到左的(我相信 C# 中的所有赋值都是如此,而且可能是 Java,尽管我没有检查后者)。但是,
我是一名优秀的程序员,十分优秀!