gpt4 book ai didi

python - 比较两个列值并找到导致差异的不同唯一值

转载 作者:太空宇宙 更新时间:2023-11-03 20:36:15 25 4
gpt4 key购买 nike

我想比较column1和column2并获取导致从column1检测到差异的唯一值(忽略NaN)。所以在这种情况下,我应该得到的答案是 tb、2 和 rexth。它将第一列与第二列进行比较

此外,我们可以创建结果并将其存储在另一列中吗?

df['diff'] = df['column1'].groupby(df['column2']).unique()

Result
index column1 column2 diff
1. John John-'tb' -tb
2. Dec-1 Dec-2 2
3. Teb12 rexth rexth
4. dx-tyr nan nan
5. [fever]='1' nan nan
6. [dsc]= rx2 NA NA or leave it empty("")
7. fv=56 fv=rt276 rt276

代码可以是 R 或 Python。我不介意

最佳答案

您可以尝试以下代码。

import pandas as pd
from numpy import NaN

def FindDifference(Row):
x = Row['column1']
y = Row['column2']
Difference = ""
if pd.isnull(y) or y=="nan" or y=="NA":
return NaN
if len(x) <= len(y):
for i in y:
if i not in x:
Difference += str(i)
else:
for i in x:
if i not in y:
Difference += str(i)
return Difference

ReadData = pd.read_csv("ThePathToYourCSVfile.csv")
ReadData['diff']= ReadData.apply(lambda x: FindDifference(x),axis=1)

关于python - 比较两个列值并找到导致差异的不同唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57151283/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com