python - 正则表达式捕获特定的百分比/小数-6ren

python - 正则表达式捕获特定的百分比/小数

转载作者：行者123 更新时间：2023-12-01 01:48:33

28

4

我正在尝试在多个网站上获取利率。数据相当非结构化，但形式足够接近。我想要捕捉的内容:

x.xx% 至 xx.xx%

数据示例:

由 FDIC 成员 WebBank 发放的所有贷款。您的实际利率取决于信用评分、贷款金额、贷款期限以及信用使用情况和历史记录。 年利率范围为 5.98% 至 35.89%。例如，您可以获得一笔 6,000 美元的贷款，利率为 7.99%，利率为 5.00%，启动费为 300 美元，年利率为 11.51%。在此示例中，您将收到 5,700 美元，并每月支付 36 美元，金额为 187.99 美元。应付总额为 6,767.64 美元。您的年利率将根据您申请时的信用来确定。截至 2017 年第一季度，启动费从 1% 到 6% 不等，平均启动费为 5.49%。没有首付，也没有预付款罚金。您的贷款的结束取决于您是否同意 www.lendingclub.com 网站上所有必需的协议(protocol)和披露。通过 LendingClub 提供的所有贷款的最低还款期限为 36 个月或更长。

3.09% – 14.24%*

固定费率:年利率 6.99% 至 24.99%锁定您的费率。您的每月付款永远不会改变。

我已经将想要捕捉的内容加粗了。我当前的正则表达式如下所示:

(re.findall('(?i)(\d\.\d\d% (?:to|-) \d\d\.\d\d%)

实际报价如下:

plcompetitors = ['https://www.lendingclub.com/loans/personal-loans',
                'https://www.marcus.com/us/en/personal-loans',
                'https://www.discover.com/personal-loans/',
                'https://www.lightstream.com/',
                'https://www.prosper.com/']

#cycle through links in array until it finds APR rates/fixed or variable using regex
for link in plcompetitors:
    cdate = datetime.date.today()
    l = r.get(link)
    l.encoding = 'utf-8'
    data = l.text
    soup = bs(data, 'html.parser')
    paragraph = soup.find_all(text=re.compile('[0-9]%'))
    for n in paragraph:
        matches = []
        matches.extend(re.findall('(?i)(\d\.\d\d% (?:to|-) \d\d\.\d\d%)', n.string))
        matches.append(cdate.isoformat())
        matches.append(link)
        print(matches)
    paragraph.append(cdate.isoformat())
    paragraph.append(link)

新输出:

['5.98% to 35.89%', '2018-06-22', 'https://www.lendingclub.com/loans/personal-loans']
['2018-06-22', 'https://www.lendingclub.com/loans/personal-loans']
['6.99% to 24.99%', '6.99% to 24.99%', '6.99% to 24.99%', '6.99% to 24.99%', '2018-06-22', 'https://www.marcus.com/us/en/personal-loans']
['2018-06-22', 'https://www.marcus.com/us/en/personal-loans']
['2018-06-22', 'https://www.discover.com/personal-loans/']
['2018-06-22', 'https://www.discover.com/personal-loans/']
['2018-06-22', 'https://www.discover.com/personal-loans/']
['6.99% to 24.99%', '2018-06-22', 'https://www.discover.com/personal-loans/']
['2018-06-22', 'https://www.discover.com/personal-loans/']
['2018-06-22', 'https://www.discover.com/personal-loans/']
['2018-06-22', 'https://www.discover.com/personal-loans/']
['2018-06-22', 'https://www.discover.com/personal-loans/']
['2018-06-22', 'https://www.lightstream.com/']
['2018-06-22', 'https://www.lightstream.com/']
['2018-06-22', 'https://www.lightstream.com/']
['2018-06-22', 'https://www.lightstream.com/']
['2018-06-22', 'https://www.lightstream.com/']
['2018-06-22', 'https://www.lightstream.com/']
['2018-06-22', 'https://www.lightstream.com/']
['2018-06-22', 'https://www.prosper.com/']
['2018-06-22', 'https://www.prosper.com/']
['2018-06-22', 'https://www.prosper.com/']
['2018-06-22', 'https://www.prosper.com/']
['2018-06-22', 'https://www.prosper.com/']
['2018-06-22', 'https://www.prosper.com/']
['2018-06-22', 'https://www.prosper.com/']
['2018-06-22', 'https://www.prosper.com/']
['2018-06-22', 'https://www.prosper.com/']
['2018-06-22', 'https://www.prosper.com/']
['2018-06-22', 'https://www.prosper.com/']

最佳答案

paragraph = soup.find_all(text=re.compile('(?i)(\d\.\d\d% (?:to|-) \d\d\.\d\d%)')) line 获取所有值与您的模式匹配的节点。您实际上需要从这些段落中提取匹配项。

使用类似的东西

matches=[]
for n in paragraph:
    matches.extend(re.findall(pattern, n.string))

至于模式本身，您可以使用

(?i)\d+(?:\.\d+)?%\s*(?:to|-)\s*\d+(?:\.\d+)?%

请参阅regex demo 。详情:

(?i) - 不区分大小写的处理已开启
\d+(?:\.\d+)? - 1+ 位数字，可选后跟 .和 1+ 位数字
% - 一个%标志
\s* - 0+ 空格
(?:to|-) -to或-
\s*\d+(?:\.\d+)?% - 参见上文(简而言之，空格、int 或 float 值，后跟 % )。

关于python - 正则表达式捕获特定的百分比/小数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50977971/

28

4

0

文章推荐： Python re.sub() 函数将文件路径中的 "\t"转换为制表符

文章推荐： javascript - Jquery Jplayer 动态播放列表

文章推荐： R 中的重复模式(整数向下和向上)

Javascript 小数
如何将整数类型转换为 double /浮点类型以显示小数点？例如，如果我想将数字转换为货币格式: 5 会变成 5.004.3 会变成 4.30 javascript 有什么东西可以用来做这种转换吗？
浮点数(小数)在计算机中如何用二进制存储？
【版权声明】未经博主同意，谢绝转载！（请尊重原创，博主保留追究权） https://www.cnblogs.com/cnb-yuchen/p/18107586 出自【进步*于辰的博客】
vba - 将存储为文本的数字转换为数字 - 小数
我意识到这是一个重复的问题，但是 this 中提到的解决方案这个问题完全不适合我。我目前的代码如下 Sub ConvertTextToNumber() Dim Area As Range, C As
Javascript 数学用逗号替换点/小数
我正在使用数学 javascript，但在用它来替换点的逗号和逗号的点时遇到了一些麻烦。我可以改变千位分隔符的逗号，但无法设法将小数点变成逗号。我尝试了其他帖子中的一些建议，但没有感到高兴。目标是实现
Android Numberpicker 小数
我正在尝试在 Android 中创建一个数字选择器，但轮子只增加 1。我想增加 0.1。我在网上查了一下，但我发现了一个格式化的浮点数组禁用了轮子。请帮助并为语法感到抱歉，我正在学习。最佳答案您可
python - 正则表达式捕获特定的百分比/小数
我正在尝试在多个网站上获取利率。数据相当非结构化，但形式足够接近。我想要捕捉的内容: x.xx% 至 xx.xx% 数据示例: 由 FDIC 成员 WebBank 发放的所有贷款。您的实际利率取决于信
MySQL:将德语字符串转换为浮点/小数
在 MySQL 表中，我有一个具有不同值的 VARCHAR 列，这些值可能代表字符串、整数、浮点、任意值。这些值作为特定于语言的字符串写入数据库，这意味着 123.45 的浮点值可以写为德语中的 "1
javascript - 正则表达式匹配字符串是否包含带有数字的整数/小数
我想编写一个正则表达式，它允许整数或具有 0 - 2 个小数位的小数。有效输入 1 1. 1.1 1.11 111111111 111111111. 111111111.1 111111111.11
javascript - 小数、逗号和客户端验证问题
我正在尝试为 nullable 实现客户端验证其小数点分隔符可以是逗号(例如:123,45)。在我看来: ... @Html.LabelFor(model => model.Turnove
php - 如何从还包含整数的字符串中仅提取 float (小数)
我找不到合适的正则表达式来仅从字符串中提取 float 。考虑以下字符串: $string = "8x2.1 3x2"; 我想提取 2.1，我尝试了以下操作，但这给了我整数和 float : preg
excel - 在excel中使用正则表达式从单位/字符串中提取第一个整数/小数
我希望使用正则表达式函数分离以下数据，如下所示: 要使用的功能: let fx=(text,regex)=> Web.Page( " var x='
javascript - 如何在我的代码中允许 "0."小数
我是 jquery 新手。我有一个带有两个输入框的表单。我实现了一些验证。 Min.Amount Max.Amount
java - 将最大的产品计数器初始化为 "infinitely"小数
我正在java中实现一个简单的算法，它接受一个整数数组，并查找并返回数组中相邻整数的最大乘积。为此，我首先初始化了一个名为largestProduct的变量，我用它来跟踪当前找到的最大(最佳)产品。
javascript - 如何 move 小数？
在 JavaScript 中，我想定义小数点的位置。我只能在示例中真正展示它。假设输入值为 1234 。我希望输出为 123.4 。或者，如果输入是 12345 ，我希望输出是 123.45 。
jquery - 只允许数字、小数、负数
我有这段代码，只允许在 keypress() 的输入字段中输入数字 if (e.which != 8 && e.which != 0 && (e.which 57)) { return fa
python - 小数(-1)是什么意思？
我目前正在开发一些基于 Django 的 Web 项目，在这个 Web 开发过程中，我遇到了以下我无法正确理解的代码。 if price_product['price'] == Decimal('-1
c++ - 无法打印更多的 pi 小数
这个问题在这里已经有了答案: How do I print a double value with full precision using cout? (17 个答案) 关闭 7 年前。我试图在
mysql - 添加两个表中的多个(小数)值以更新第三个表
这应该是微不足道的，但我正在兜圈子，也许有人可以提供帮助。我有两个表(T1，T2)，我希望从中提取每行中的多个值并更新第三个表(T3)的内容当且仅当)T1 中有两个 UQ，NN 字段，T2 匹配，在
javascript - 查找整数并附加 .00 小数
如果数字不是十进制，我需要附加.00，但是当我尝试下面的代码时，它会将整个数字更改为0.00。例如，如果数字是12,200，它会将其更改为0.00，而不是在末尾添加.00 $('.total-amou
ios - Swift:自动布局以编程方式导致错误的帧大小(小数)
我正在尝试在容器 View 中设置 9:16 纵横比 View 。以下代码在 viewDidLayoutSubviews 中设置约束，以便在正确的位置考虑自动布局。它还调用 layoutIfNeede

首页

博学

6Ren·AI

商城

python - 正则表达式捕获特定的百分比/小数