gpt4 book ai didi

python - 从文本中剥离 DataFrame 列以生成整数

转载 作者:行者123 更新时间:2023-12-04 08:27:47 27 4
gpt4 key购买 nike

我找不到一种简单的方法来做到这一点,而且所有复杂的方法都不起作用。你能帮我吗?
我有一个由网络抓取产生的数据框。在那里,我有一个 data['Milage'] 列,其结果如下:“80,000 英里”。显然这是一个字符串,所以我正在寻找一种方法来删除所有不是数字的内容并将该字符串转换为纯数字
'80,000 英里' -> '80000'
我尝试了以下方法:

data['Milage'] = data['Milage'].str[1:].astype(int)
不知道上面的代码是做什么的,我是从这里的另一篇文章中获取的。但我收到以下错误消息:
  File "autotrader.py", line 73, in <module>
data['Milage'] = data['Milage'].str[1:].astype(int)
AttributeError: 'str' object has no attribute 'str'
我尝试的另一个解决方案是:
data['Milage'] = str(data['Milage']).extract('(\d+)').astype(int)
由此产生的错误如下:
  File "autotrader.py", line 73, in <module>
data['Milage'] = str(data['Milage']).extract('(\d+)').astype(int)
AttributeError: 'str' object has no attribute 'extract'
我将不胜感激任何帮助!谢谢

最佳答案

经过一些测试问题是data是字典,需要处理dfDataFrame .
我认为您需要删除非数值并转换为整数:

df['Milage'] = df['Milage'].str.replace('\D','').astype(int)
print(df['Milage'])
0 70000
1 69186
2 46820
3 54000
4 83600
5 139000
6 62000
7 51910
8 86000
9 38000
10 65000
11 119000
12 49500
13 60000
14 35000
15 57187
16 45050
17 80000
18 84330
19 85853
Name: Milage, dtype: int32

关于python - 从文本中剥离 DataFrame 列以生成整数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65182467/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com