gpt4 book ai didi

python-3.x - 从包含数字、非数字和数字的字符串中提取第一个数字序列

转载 作者:行者123 更新时间:2023-12-02 20:06:13 27 4
gpt4 key购买 nike

我在 Pandas 数据框中有一列,其中包含如下值:

111042345--
111042345
110374217dclid=CA-R3K
109202817lciz@MM10082IA

我需要提取每行中的第一个数字序列 - 而不是该行中的所有数字。所以输出会是这样的:

111042345
111042345
110374217
109202817

我认为实现这一目标的最佳方法是将字符串按数字分割并返回,但这会给我在非数字字符后面留下不需要的数字。

最佳答案

使用str.extract使用正则表达式 \d 提取数字,{,5} 表示前 5 位数字,+ 表示所有数字:

df['first_5_digits'] = df['Col'].str.extract('(\d{,5})')
df['all_digits'] = df['Col'].str.extract('(\d+)')
print (df)
Col first_5_digits all_digits
0 111042345-- 11104 111042345
1 111042345 11104 111042345
2 110374217dclid=CA-R3K 11037 110374217
3 109202817lciz@MM10082IA 10920 109202817

就像@Jon Clements指出的那样,也可以通过索引提取N个值:

df['first_5_digits'] = df['Col'].str.extract('(\d+)').str[:5]

关于python-3.x - 从包含数字、非数字和数字的字符串中提取第一个数字序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54595070/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com