gpt4 book ai didi

python - 提取美元金额

转载 作者:行者123 更新时间:2023-12-04 15:24:54 27 4
gpt4 key购买 nike

以前有人问过这个问题,但我仍然无法完全解决这个问题。我有以下字符串示例:

"Transfer to Retirement Rsvs-MA FX                   .11"                
"Opening Balance FX 342,536,002.63"
"VA 85.85"
"VB .00"
"Manual Adjustment FX 6,838.36-"

我想将字符串中的美元/美分金额提取到数据框的单独列中。我有以下正则表达式:

rx = (r"(\$?(?:\d+,)*\d+\.\d+\-?)")

我尝试在数据框 (df) 中创建一个名为“dollars”的列

df2['dollars']=df2['description'].str.extract(rx)

除了像 .11 或 .00 这样的值,它在大多数情况下都有效,在这种情况下会返回 nan。我如何修改此表达式以使其在不带前导美元的情况下适用于美分?

非常感谢您的帮助!

string                                                       dollars
Transfer to Retirement Rsvs-MA FX .11 0.11
Opening Balance FX 342,536,002.63 342,536,002.63
VA 85.85 85.85
VB .00 .00
Manual Adjustment FX 6,838.36- 6,836-

最佳答案

你可以使用

r'\$?(?<!\d)(?:\d{1,3}(?:,\d{3})*|\d{4,})?\.?\d+'

参见 regex demo

详情

  • \$? - 一个可选的 $字符
  • (?<!\d) - 确保左边没有数字
  • (?:\d{1,3}(?:,\d{3})*|\d{4,})? - 两种模式之一:
    • \d{1,3}(?:,\d{3})* - 1 到 3 位数字后跟 0 次或多次出现的逗号和三位数字
    • | - 或者
    • \d{4,} - 四位数或更多位数
  • \.? - 一个可选的点
  • \d+ - 1 个以上数字。

关于python - 提取美元金额,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62474390/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com