gpt4 book ai didi

python - Pandas - 去除空白

转载 作者:太空狗 更新时间:2023-10-29 20:32:58 24 4
gpt4 key购买 nike

我正在使用 python csvkit 来比较 2 个文件,如下所示:

df1 = pd.read_csv('input1.csv', sep=',\s+', delimiter=',', encoding="utf-8")
df2 = pd.read_csv('input2.csv', sep=',\s,', delimiter=',', encoding="utf-8")
df3 = pd.merge(df1,df2, on='employee_id', how='right')
df3.to_csv('output.csv', encoding='utf-8', index=False)

目前我正在通过脚本运行文件,该脚本会从 employee_id 列中删除空格。

employee_id 的示例:

37 78973 3
23787
2 22 3
123

有没有办法让 csvkit 执行此操作并节省我的步骤?

最佳答案

您可以使用 .str.strip() 在 Pandas 中strip() 整个系列:

df1['employee_id'] = df1['employee_id'].str.strip()
df2['employee_id'] = df2['employee_id'].str.strip()

这将删除 df1df2employee_id 列的前导/尾随空格

或者,您可以修改 read_csv 行以也使用 skipinitialspace=True

df1 = pd.read_csv('input1.csv', sep=',\s+', delimiter=',', encoding="utf-8", skipinitialspace=True)
df2 = pd.read_csv('input2.csv', sep=',\s,', delimiter=',', encoding="utf-8", skipinitialspace=True)

看起来您正试图删除包含数字的字符串中的空格。您可以通过以下方式执行此操作:

df1['employee_id'] = df1['employee_id'].str.replace(" ","")
df2['employee_id'] = df2['employee_id'].str.replace(" ","")

关于python - Pandas - 去除空白,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43332057/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com