gpt4 book ai didi

python - 如何删除pandas数据框中的特殊字符

转载 作者:行者123 更新时间:2023-12-01 08:55:38 25 4
gpt4 key购买 nike

这是我正在使用的数据示例:

Reviews  Size     Installs  Type     Price      Content Rating  
0 159 19M 10,000+ paid $9.99 Everyone
1 967 14M 500,000+ paid $0.99 Everyone
2 87510 8.7M 5,000,000+ paid $1.9 Everyone
3 215644 25M 50,000,000+ paid $7.50 Teen
4 967 2.8M 100,000+ Free 0 Everyone

我想按价格对数据帧进行排序,但由于“价格”列中值的数据类型是字符串,因此我无法对数据帧进行排序,并且由于字符“$”而无法转换值。有没有办法在不删除“$”的情况下成功删除它或对数据框进行排序?

我尝试了以下操作,只是为了看看是否可以对目标列进行排序:

 df = pd.read_csv('googleplaystore.csv')
category = df['Price'].tolist()
c = list(set(category))
print (sorted(c))

最佳答案

您可以使用str.replace

df['Price'] = df.Price.str.replace('$','')
df.sort_values('Price')

如果您不想删除字符$,您可以使用

df = df.iloc[df.Price.str.replace('$','').astype(float).sort_values().index,:]
df.reset_index(drop=True) # To reset index

但是您应该将列转换为数字,以便能够对数据框进行数字操作。

关于python - 如何删除pandas数据框中的特殊字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52791240/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com