gpt4 book ai didi

python - 使用 pandas 检查哪一列存在值

转载 作者:太空宇宙 更新时间:2023-11-03 20:04:43 25 4
gpt4 key购买 nike

我对 Pandas 还很陌生。我有 2 个数据集,第一个数据集如下所示:

Timestamp_info    Id_info
2019-11-25 2
2019-11-25 3
2019-11-25 4
2019-11-25 5
2019-11-25 10

第二个看起来像这样:

Date                         Click_id
2019-11-25 00:00:06+00:00 1
2019-11-25 00:00:06+00:00 2
2019-11-25 00:00:06+00:00 4
2019-11-25 00:00:06+00:00 5
2019-11-25 00:00:06+00:00 7

我正在尝试输出一个具有以下结构的 .CSV 文件:

Timestamp    Id    Exists in the first file   Exists in the second file
2019-11-25 1 False True
2019-11-25 2 True True
2019-11-25 3 True False
2019-11-25 4 True True
2019-11-25 10 True False
...

我想象解决这个问题的方法是将两个文件合并为一个,然后我将获得时间戳和 Id 的完整列表

df_one = first_file
df_two = second_file
full_file = pd.concat(df_one,df_two,axis=1)

但是文件的连接方式不是我想要的:

Timestamp_info  Id_info  Date                         Click_id
2019-11-25 5
2019-11-25 00:00:06+00:00 10

从这里开始,我不知道如何继续正确合并文件并检查哪个文件存在 id 并在列中添加 TRUE 或 FALSE 值。

感谢您的建议。

最佳答案

我自己解决了,答案如下:

重命名两个数据文件,使它们具有相同的列名称:

renamed_one = df_one.rename(columns={'Timestamp_info':'Date','Id_info':'Id'})
renamed_two = df_one.rename(columns={'Date':'Date','Click_Id':'Id'})
frames = [renamed_one,renamed_two]
result = pd.concat(frames)
result['In the first file'] = result['Id'].isin(renamed_one['Id'])
result['In the second file'] = result['Id'].isin(renamed_two['Id'])
export = result.to_csv('Final export', encoding='utf-8', index = False)

关于python - 使用 pandas 检查哪一列存在值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59029818/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com