gpt4 book ai didi

python - 从字符串中提取带有空格的整数

转载 作者:行者123 更新时间:2023-11-30 21:57:51 24 4
gpt4 key购买 nike

我对正则表达式非常陌生,所以我在编写代码时遇到了困难。

我有一个数据框,df,结构如下:

                                    NAME  PERCENT
0 APPLE COMPANY A 57 638 232 stocks 0.12322
1 BANANA 1 COMPANY B 12 946 201 stocks 0.02768
2 ORANGE COMPANY C 8 354 229 stocks 0.01786

df = pd.DataFrame({
'NAME': ['APPLE COMPANY A 57 638 232 stocks', 'BANANA 1 COMPANY B 12 946 201 stocks', 'ORANGE COMPANY C 8 354 229 stocks'],
'PERCENT': [0.12322, 0.02768 , 0.01786]
})

我想从NAME中提取整数,但不是所有整数(请注意,在第1行中,我们有BANANA 1 COMPANY B,我想忽略整数1COMPANY 之前。我只想提取 stocks 之前的那些整数。

我希望输出如下所示:

                 NAME  PERCENT    STOCKS
0 APPLE COMPANY A 0.12322 57638232
1 BANANA 1 COMPANY B 0.02768 12946201
2 ORANGE COMAPNY C 0.01786 8354229

到目前为止我只有这个,它不能产生我想要的:

df['NAME'].str.findall(r'\b\d+\b')

编辑:请注意,股票数量可能会从数千变为数百万,这意味着没有模式。

最佳答案

正则表达式将提取您要查找的内容

\d+\s\d+\s\d+

匹配:

57 638 232

12 946 201

8 354 229

来自:

'NAME': ['APPLE COMPANY A  57 638 232 stocks', 'BANANA 1 COMPANY B  12 946 201 stocks', 'ORANGE COMPANY C  8 354 229 stocks']

关于python - 从字符串中提取带有空格的整数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55123177/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com