gpt4 book ai didi

Python提取可量化文本(数字)

转载 作者:行者123 更新时间:2023-12-01 09:28:33 25 4
gpt4 key购买 nike

您好,我想使用 python 并提取文本,该文本可以是数值或拼写出来的数字加上找到的值之前和之后的第一个单词。

示例文本:

I have 2 brothers and they bought one car each. My oldest brother invested 1,000 dollars.

预期输出:

“有 2 个兄弟”、“买了一辆车”、“投资了 1000 美元”

我已经尝试过了>

>>> import re
>>> str = "I have 2 brothers and they bought one car each. My oldest brother invested 1,000 dollars."
>>> print re.findall("\d+", s)
['2']

但是,这仅适用于查找值,而不适用于拼写出来的术语one。我也不知道用什么来获取找到的单词之前和之后的单词。

最佳答案

这个快速而肮脏的正则表达式:

pat = re.compile(r'(\w+\s+)([\d,]+|one|two|three|four|five|six|seven|eight|nine)(\s+\w+)')

确实产生了你想要的输出。当然,它只能找到用英文拼写的个位数。对于任意数字,您需要使用适当的解析器。但这可能足以满足您想做的事情。

关于Python提取可量化文本(数字),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50145945/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com