gpt4 book ai didi

python - 如何创建循环来纠正数据框中的性别

转载 作者:行者123 更新时间:2023-11-30 08:56:06 29 4
gpt4 key购买 nike

使用gender_guesser.detector包后,我得到了df的新“性别”列,总结如下。我想将“moSTLy_female”更改为“female”;并将“moSTLy_male”和“andy”更改为“male”;我编写的代码如下,但生成错误。如何修复它?非常感谢!未知 1125男321女225主要_男性 29主要_女性 26安迪15

随机导入将 numpy 导入为 np

对于索引,df.iterrows() 中的 g:

if g == 'mostly_female':
df.loc[index, 'gender'] = 'female'

elif g == 'mostly_male':
df.loc[index, 'gender'] = 'male'

elif g == 'andy':
df.loc[index, 'gender'] = 'male'

elif g == 'unknown':
df.loc[index, 'gender'] = np.random.choice(['female', 'male'], size=1)

else:
print('error')

ValueError:系列的真值不明确。使用a.empty、a.bool()、a.item()、a.any()或a.all()

另外,有什么建议如何根据“名字”将“未知”修改为“男性”和“女性”吗?

我确实需要将“未知”分别更改为男性/女性,但不知道如何处理1130观察。这里有很多名字......'Cyrenna','Dacks','Daella','Daella','Daemon','Daeron','Daeron','Dafyn','Dagon','Dake','Danwell' , '女儿', '黛琳娜', '迪肯', '多内尔', '哈伦', '哈罗德', '哈温', '白霜', '霍克', '热', '霍瑟', '汉弗雷', '汉弗雷”、“杰瑞米”、“杰奥”、“杰恩”、“杰恩”、“唐纳尔”、“杰恩”、“杰恩”、“杰恩”、“贾科”、“吉基”、“伊耿”、“伊耿” , 'Aerion', 'Aladale', 'Alester', 'Bannen', 'Belandra', 'Belwas', 'Benjen', 'Benjen', 'Beric', 'Black', 'Bore'

最佳答案

您可以通过为您需要的每个键传递替换值来使用map方法。

df['gender'] = df['gender'].map({
'mostly_female': 'female',
'mostly_male': 'male',
'andy': 'male',
'unknown': np.random.choice(['female', 'male'], size=1)
})

关于python - 如何创建循环来纠正数据框中的性别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59912299/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com