gpt4 book ai didi

java - 如何捕获 Java 中正则表达式匹配后面的文本?

转载 作者:行者123 更新时间:2023-12-01 05:04:41 27 4
gpt4 key购买 nike

我正在完成一项任务,需要搜索网站并提取转化率。

如果我能够简单地匹配汇率,那么捕获和提取就很容易,但我需要能够点击更新按钮并让程序搜索更新的转化率,所以我无法简单地硬编码要搜索的匹配项。

有没有办法可以匹配费率之前的文本并捕获匹配之后的所有文本?

如果有更好的方法来做到这一点,我也愿意接受建议。我只需要帮助来了解当我不知道确切的费率时如何从网站获取费率。我只知道费率的格式以及费率在网站内的位置。

这是我到目前为止所拥有的:

String regex = "(?<=EUR'>)\\d+(?:\\.\\d*)?(?=<)";

Pattern pattern = Pattern.compile(regex);
Matcher match = pattern.matcher(?);

while (match.find()) {
System.out.println("Found a match: " + match.group(1).toString());
System.out.println("Start position: " + match.start(1));
System.out.println("End position: " + match.end(1));
}

我想我明白如何设置模式,但如果我只知道开始和结束而不知道结束,我不确定应该为匹配字符串添加什么...

我需要抓取的一个示例是下面的行

<td class='rtRates'><a href='/graph/?from=USD&amp;to=EUR'>0.772000</a></td>

我需要获取这一行的汇率,但它会不断变化

最佳答案

不要使用正则表达式来解析 html,否则迅猛龙会来吃掉你。使用类似 jsoup 的内容和 <a> 的查询值<td> 内的元素与类rtRates .

关于java - 如何捕获 Java 中正则表达式匹配后面的文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12889818/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com