gpt4 book ai didi

python - 在 Python 中创建一个新文件,其中包含两个数据帧上的常见匹配项

转载 作者:行者123 更新时间:2023-12-01 07:38:17 26 4
gpt4 key购买 nike

dataset2.csv 需要在 dataset1.csv 的第一列上查找匹配项,output.csv 只需要包含匹配项和一些属性。第一列是一个字符串。

Dataset1.csv
Name age
John 2
Peter 1
Sara 3
Dataset2.csv
Name city Time
John NY, NY 3:10AM
Peter LA, CA 7:45PM
Output.csv
Name age city Time
John 2 NY, NY 3:10AM
Peter 1 LA, CA 7:45PM
import pandas as pd
import numpy as np

df1 = np.loadtxt('Dataset1.csv')

df2 = np.loadtxt('Dataset2.csv')


df1 = pd.DataFrame(df1,columns=['name','age'])
df2 = pd.DataFrame(df2,columns=['name','city','Time'])

print(df1)
print(df2)
intersected_df = pd.merge(df1, df2, how='inner')
print(intersected_df)

最佳答案

不要使用np.loadtxt进行读取,而是使用pandas read_csv函数,并且还有一个on 参数并指定列,在本例中 Name:

import pandas as pd
df1 = pd.read_csv('Dataset1.csv', sep='\s\s+', engine='python')
df2 = pd.read_csv('Dataset2.csv', sep='\s\s+', engine='python')
intersected_df = pd.merge(df1, df2, on='Name')
print(intersected_df)

输出:

    Name  age    city    Time
0 John 2 NY, NY 3:10AM
1 Peter 1 LA, CA 7:45PM

关于python - 在 Python 中创建一个新文件,其中包含两个数据帧上的常见匹配项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56862260/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com