作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个来自 Kaggle 泰坦尼克号竞赛的 CSV 文件,如下所示。该文件的记录格式由以下列描述:PassengerId, Survived, Pclass, Name, Sex, Age, SibSp, Parch, Ticket, Fare, Cabin, Embarked.我想分析这个文件中的数据,看看跟团旅行的乘客是否有更好的生存率。为此,我假设 Ticket 的值对于一组中的所有乘客都是相同的。
我在 MS Access 中加载了 CSV,并执行了以下查询以获得所需的结果集:
SELECT a.Ticket, a.PassengerId, a.Survived
FROM train a
WHERE 1 < (SELECT COUNT(*) FROM train b WHERE b.Ticket = a.Ticket)
ORDER BY a.Ticket
如果不编写循环,我无法提取与上面相同的结果集。
最佳答案
让我们看看这是否匹配:
df.groupby(['Ticket']).filter(lambda x: x.Ticket.count()>1)[['Ticket','PassengerId','Survived']]
或者根据 Jezrael 的建议:
df.groupby(['Ticket']).filter(lambda x: len(x)>1)[['Ticket','PassengerId','Survived']]
我在 Tickets 上使用 groupby
,然后使用 filter
将我的数据框过滤到该票证组中的计数大于 1 的那些记录。
关于python - 如何在 Pandas 中执行相当于相关子查询的操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43574675/
现在我正在尝试实现 flash programming specification对于 PIC32MX。我正在使用 PIC32MX512L 和 PIC32MX512H。 PIC32MX512L最终必须
我是一名优秀的程序员,十分优秀!