gpt4 book ai didi

python - 剥离/修剪数据帧的所有字符串

转载 作者:IT老高 更新时间:2023-10-28 20:36:54 27 4
gpt4 key购买 nike

在 python/pandas 中清理多类型数据框的值,我想修剪字符串。我目前正在按照两个说明进行操作:

import pandas as pd

df = pd.DataFrame([[' a ', 10], [' c ', 5]])

df.replace('^\s+', '', regex=True, inplace=True) #front
df.replace('\s+$', '', regex=True, inplace=True) #end

df.values

这很慢,我有什么可以改进的?

最佳答案

您可以使用 DataFrame.select_dtypes选择 string 列,然后选择 apply 函数 str.strip .

注意:值不能是 typesdictslists,因为它们的 dtypes对象

df_obj = df.select_dtypes(['object'])
print (df_obj)
0 a
1 c

df[df_obj.columns] = df_obj.apply(lambda x: x.str.strip())
print (df)

0 1
0 a 10
1 c 5

但如果只有几列,请使用 str.strip :

df[0] = df[0].str.strip()

关于python - 剥离/修剪数据帧的所有字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40950310/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com