gpt4 book ai didi

python - Lambda 应用 : Referencing other rows and columns

转载 作者:行者123 更新时间:2023-12-04 08:22:57 24 4
gpt4 key购买 nike

我正在尝试根据给定单元格周围的值更改数据集中给定列的值。
考虑以下数据:

Data = {'Col1': [5593 , 5114 , 6803 , 2175 , 2175] , 'Col2': [2879 , 1176 , 7114 , 8677 , 0]}
df = pd.DataFrame(data = Data)
df.head()

Col1 Col2
0 5593 2879
1 5114 1176
2 6803 7114
3 2175 8677
4 2175 0
我创建一个新列来存储新值:
Data['Col3'] = Data['Col2']
我想做一个 apply - lambda 函数,它执行以下操作:
如果 Col3 为零并且 Col1 的先前值等于 Col1 的当前值,即:(x.shift(-2 , -1) == x.shift(-2, 0),则 Col3 的实际值应为Col2 的先前值,即 x.shift(-1 , -1). 否则 Col3 的值应该保持不变。
我已经尝试过如下(伪代码):
df['Col3'] = df['Col3'].apply(lambda x: x.shift(-1 , -1) if (x == 0 and x.shift(-2 , -1) == x.shift(-2, 0)) else x)
对于这个特定的数据子集,我的数据应该如下所示:
Col1    Col2    Col3
0 5593 2879 2879
1 5114 1176 1176
2 6803 7114 7114
3 2175 8677 8677
4 2175 0 8677
我不确定 shift 是否是正确的使用方法(该系列包含 NaN),但希望这个想法很清楚。
我的真实数据集非常大,所以我希望操作在多行上表现良好。

最佳答案

IIUC,你可以用np.where使用移位的列:

df['Col3'] = np.where(df['Col1'].shift().eq(df['Col1']), df['Col2'].shift(), df['Col2'])
print(df)
输出
   Col1  Col2    Col3
0 5593 2879 2879.0
1 5114 1176 1176.0
2 6803 7114 7114.0
3 2175 8677 8677.0
4 2175 0 8677.0
下面是一步一步的解释和评论:
# create a mask, where is True if the consecutive values in Col1 are equal
mask = df['Col1'].shift().eq(df['Col1'])

# choose between the shifted Col2 (the previous value) and Col2 using the mask
df['Col3'] = np.where(mask, df['Col2'].shift(), df['Col2'])

print(df)

关于python - Lambda 应用 : Referencing other rows and columns,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65410819/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com