gpt4 book ai didi

python - 遍历数据框中选定列的行到每行 "clean"

转载 作者:行者123 更新时间:2023-11-28 22:10:33 25 4
gpt4 key购买 nike

我想为统计分析准备数据,但遇到了数据集中的空白问题。我的函数哪里出错了?

这是我创建的代码,使用通常可以解决问题的函数。不幸的是,数据帧似乎并非如此。有关数据框的一些背景信息:我要清理的列是“LOCATION”,其中包含描述地址的字符串。

for i in data.index:
data.at[i, "LOCATION"] = data.at[i, "LOCATION"].split()
data.at[i, "LOCATION"] = " ".join(data.at[i, "LOCATION"])

示例行(未清理)'15300________SATICOY____________ST' *_代表空格

使用 split() ['15300', 'SATICOY', 'ST'] 后的表示行

加入'1 5 3 0 0 S A T I C O Y S T'后

在我真正想要将字符串重新连接在一起之前,代码工作正常。我的目标是加入由空格分隔的字符串,因此“15300 SATICOY ST”。

感谢您的帮助!

最佳答案

这里不用循环,用Series.str.replace使用 regex 表达式 \s+ (1 个或多个空白字符)。将其替换为 1 个空格:

data['LOCATION'] = data['LOCATION'].str.replace('\s+', ' ')

关于python - 遍历数据框中选定列的行到每行 "clean",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56576306/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com