gpt4 book ai didi

python - 遍历 pandas DataFrame 中的选择单元格并替换值

转载 作者:太空宇宙 更新时间:2023-11-04 02:49:53 26 4
gpt4 key购买 nike

我有一个类似于以下示例的 pandas DataFrame:

      tags      tag1      tag2      tag3
0 [a,b,c] 0 0 0
1 [a,b] 0 0 0
2 [b,d] 0 0 0
...
n [a,b,d] 0 0 0

如果 tags 数组中存在该行索引。

但是,我不太清楚如何正确地迭代;到目前为止,我的想法如下:

for i, row in dataset.iterrows():
for tag in row[0]:
for column in range (1,4):
if dataset.iloc[:,column].index == tag:
dataset.set_value(i, column, 1)

但是,从该方法返回数据集时,列仍然全部为 0 值。

谢谢!

最佳答案

看来你需要:


df1 = df['tags'].astype(str).str.strip('[]').str.get_dummies(', ')
print (df1)
'a' 'b' 'c' 'd'
0 1 1 1 0
1 1 1 0 0
2 0 1 0 1
3 1 1 0 1

最后将 df1 添加到原始 DataFrame by concat :

df = pd.concat([df,df1], axis=1)
print (df)
tags tag1 tag2 tag3 'a' 'b' 'c' 'd'
0 [a, b, c] 0 0 0 1 1 1 0
1 [a, b] 0 0 0 1 1 0 0
2 [b, d] 0 0 0 0 1 0 1
3 [a, b, d] 0 0 0 1 1 0 1

关于python - 遍历 pandas DataFrame 中的选择单元格并替换值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44223874/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com