gpt4 book ai didi

python - Pandas 数据框 : Extracting float values from string in a column

转载 作者:太空宇宙 更新时间:2023-11-04 01:47:16 25 4
gpt4 key购买 nike

我正在尝试从特定列的字符串中提取浮点值。

原始输出

DATE        strCondition
4/3/2018 2.9
4/3/2018 3.1, text
4/3/2018 2.6 text
4/3/2018 text, 2.7

和其他变体。我也尝试过正则表达式,但我的知识有限,我想出了:

clean = df['strCondition'].str.contains('\d+km')
df['strCondition'] = df['strCondition'].str.extract('(\d+)', expand = False).astype(float)

输出最终看起来像这样显示主要整数的地方...

DATE        strCondition
4/3/2018 2.0
4/3/2018 3.0
4/3/2018 2.0
4/3/2018 2.0

我想要的输出是这样的:

DATE        strCondition
4/3/2018 2.9
4/3/2018 3.1
4/3/2018 2.6
4/3/2018 2.7

非常感谢您的时间和意见!

编辑:我忘了提到在我的原始数据框中有类似于 strCondition 的条目

2.9(1.0) #where I would like both numbers to get returned
11/11/2018 #where this date as a string object can be discarded

对于给您带来的不便,我们深表歉意!

最佳答案

尝试:

df['float'] = df['strCondition'].str.extract(r'(\d+.\d+)').astype('float')

输出:

       DATE strCondition  float
0 4/3/2018 2.9 2.9
1 4/3/2018 3.1, text 3.1
2 4/3/2018 2.6 text 2.6
3 4/3/2018 text, 2.7 2.7

关于python - Pandas 数据框 : Extracting float values from string in a column,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58807577/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com