作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 Pandas 数据框中有一列,其中包含如下值:
111042345--
111042345
110374217dclid=CA-R3K
109202817lciz@MM10082IA
我需要提取每行中的第一个数字序列 - 而不是该行中的所有数字。所以输出会是这样的:
111042345
111042345
110374217
109202817
我认为实现这一目标的最佳方法是将字符串按数字分割并返回,但这会给我在非数字字符后面留下不需要的数字。
最佳答案
使用str.extract
使用正则表达式 \d
提取数字,{,5}
表示前 5 位数字,+
表示所有数字:
df['first_5_digits'] = df['Col'].str.extract('(\d{,5})')
df['all_digits'] = df['Col'].str.extract('(\d+)')
print (df)
Col first_5_digits all_digits
0 111042345-- 11104 111042345
1 111042345 11104 111042345
2 110374217dclid=CA-R3K 11037 110374217
3 109202817lciz@MM10082IA 10920 109202817
就像@Jon Clements指出的那样,也可以通过索引提取N个值:
df['first_5_digits'] = df['Col'].str.extract('(\d+)').str[:5]
关于python-3.x - 从包含数字、非数字和数字的字符串中提取第一个数字序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54595070/
我是一名优秀的程序员,十分优秀!