gpt4 book ai didi

Python PANDAS - 符号前的子字符串第一个 INT 或 FLOAT

转载 作者:行者123 更新时间:2023-11-30 22:32:02 28 4
gpt4 key购买 nike

我在 PANDAS 数据框中有一个字符串列,我希望使用子字符串来创建一个新列。该列的一般格式是这样的:

"THING 10MG/OTHER THING 100MG"
"THING 10MG"
"THING 10.5MG"
"THING 10.5MCG"

我需要的是正则表达式或其他模式匹配技术来提取这些结果:

"10"
"10"
"10.5"
"10.5"

结果是 MG 或 MCG 之前第一次出现的 float 或 int(从左开始)。

到目前为止,我所得到的结果显然不完整:

df['string_field'].str.extract('(\d+)MG')

任何有效的方法或技巧将不胜感激。谢谢。

最佳答案

一个可行的解决方案:

\b(\d+(\.\d+)?)MC?G

\b 是字边界。 ? 表示它是可选的。这对团队或角色都有效。

Live demo

关于Python PANDAS - 符号前的子字符串第一个 INT 或 FLOAT,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45619960/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com