gpt4 book ai didi

python - 使用多列条件创建变量 (PANDAS)

转载 作者:太空宇宙 更新时间:2023-11-03 17:53:28 24 4
gpt4 key购买 nike

我有一个名为 HouseholdSize 的列和一个名为 Independent 的列。如果 HouseholdSize 等于 1 并且 Independent 不等于 1,我想创建一个等于 1 的变量。我当前的代码如下所示:

        df["HH1flag"] = df.where((df.HouseholdSize ==1) & (df.Independent != 1).notnull().astype(int))
HH1flag = df[df.HH1flag == 1]
pd.DataFrame(HH1flag, columns=["LocIdent","HouseholdSize","Independent"]).to_csv(Targcsv, mode='ab')

我收到以下错误:AttributeError:“float”对象没有属性“all”

编辑:在 EdChum 的帮助下,我向这个问题添加了更多信息。我修改后的代码的简化版本如下所示:

import pandas as pd
from pandas import *
import csv

FileName='HouseholdSizeTest.xlsx'
data=pd.read_excel(FileName,'Sheet1')
df=pd.DataFrame(data)
Targcsv=('target.csv')

HH1Text= [['Table C.1 HouseholdSize Check 1']]
with open(Targcsv,'ab') as f:
titles=csv.writer(f)
titles.writerow([])
titles.writerows(HH1Text)
titles.writerow([])

df["HH1flag"] = df[(df.HouseholdSize ==1) & (df.Independent != 1)].notnull().astype(int)
HH1flag = df[df.HH1flag == 1]
pd.DataFrame(HH1flag, columns=["LocIdent","HouseholdSize","Independent"]).to_csv(Targcsv, mode='ab')

对于同一行,我收到一个新错误。错误是 ValueError: 传递的项目数量错误 3,放置意味着 1。我正在努力将数据放入正确格式的编辑中,但想象三种情况。第一个为 Independent=1 且 HouseholdSize=1,第二个为 Independent=0 且 HouseholdSize=3,第三个为 Independent=47 且 HouseholdSize=1。对于第三种情况,HH1flag 应等于 1。

最佳答案

如果你想要一个指示器列,那么你可以使用np.where:

df["HH1flag"] = np.where((df.HouseholdSize ==1) & (df.Independent != 1), 1, 0)

因此,这使用传入的条件,如果 true 返回 1,如果 false 返回 0。

我的第一个建议不起作用的原因是这会返回一个包含多个列值的系列,这不是您想要的。

当您执行df.where时,它不喜欢尝试转换您的系列并引发AttributeError:

AttributeError: 'float' object has no attribute 'all'

我不知道它为什么这样做,你的数据没有什么特别的,因为我能够用一个仅由整数组成的简单 df 来重现它。

关于python - 使用多列条件创建变量 (PANDAS),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28813732/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com