我是 python 的新手,正在研究字符串操作
我有一个数据框
df['Installs']
Out[22]:
0 10,000+
1 500,000+
2 5,000,000+
3 50,000,000+
4 100,000+
5 50,000+
如何删除“+”并将 df 中的字符串转换为 float ?
我的输入:
df['Installs'] = df['Installs'].str.replace('+','',regex=True).astype(float)
但是我得到一个错误:
ValueError: could not convert string to float: '10,000'
我如何编辑我的代码,使我得到 10,000.0 作为我的输出等其他值而不是 10,000+
使用Series.str.replace
用 ,
和 +
来清空 string
:
df['Installs'] = df['Installs'].str.replace('[,+]','').astype(float)
#alternative
#df['Installs'] = df['Installs'].replace('[,+]','', regex=True).astype(float)
print (df)
Installs
0 10000.0
1 500000.0
2 5000000.0
3 50000000.0
4 100000.0
5 50000.0
我是一名优秀的程序员,十分优秀!