java - 现在，我怎样才能从屏幕上抓取这样的html行(使用java)？-6ren

java - 现在，我怎样才能从屏幕上抓取这样的html行(使用java)？

转载作者：行者123 更新时间：2023-12-01 15:15:14

27

4

我正在尝试筛选抓取一个 html 页面，以便我可以从中提取所需的有值(value)的数据并将其放入文本文件中。到目前为止，一切进展顺利，直到我在 html 页面中遇到了这个:

<td> <b>In inventory</b>: 0.3 &#107;&#103;<br /><b>Equipped</b>: -4.5&#160;kg

页面 html 代码中的上述行通常会有所不同。因此，它需要找到一种方法来扫描线(无论它包含什么)以获取权重(在本例中为 0.3 和 -4.5)并将这些数据存储到 2 个单独的 double 中:

双 inventoryWeight = 0.3
双 EquipmentWeight = -4.5

我希望使用纯java来完成此操作；如果需要，请随时通知我可以在我的 java 应用程序中执行的任何第三方程序来实现此目的(但如果是这样，请生动地解释)。

非常感谢!

最佳答案

RegEx通常是抓取文本的一个很好的解决方案。括号表示“捕获组”，这些组被存储起来，然后可以使用 Matcher.group() 进行访问。 [-.\d]+ 匹配由一位或多位数字 (0-9)、句点和连字符组成的任何内容。 .* 匹配任何内容(但有时不匹配换行符)。在这里它只是用来本质上“扔掉”你不关心的一切。

import java.util.regex.*;

public class Foo {
    public static void main(String[] args) {
        String regex = ".*inventory<\\/b>: ([-.\\d]+).*Equipped<\\/b>: ([-.\\d]+).*";
        String text = "<td> <b>In inventory</b>: 0.3 &#107;&#103;<br /><b>Equipped</b>: -4.5&#160;kg";

        // Look for a match
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(text);

        // Get the matched text
        if (matcher.matches()) {
            String inventoryWeight = matcher.group(1);
            String equippedWeight = matcher.group(2);

            System.out.println("Inventory weight: " + inventoryWeight);
            System.out.println("Equipped weight: " + equippedWeight);
        } else {
            System.out.println("No match!");
        }
    }
}

关于java - 现在，我怎样才能从屏幕上抓取这样的html行(使用java)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11712185/

27

4

0

文章推荐： java - 使用设备管理时应用程序中的 Android 实例化异常

文章推荐： python - 将 3 维数组转换为 2 维数组

文章推荐： react-native - react native 如何链接官方库(如 CameraRoll)？

文章推荐： java - Lucene 的近实时搜索实现

PHP 获取日期与今天的日期之间的天数差异(现在)
我似乎无法让它发挥作用。我已经尝试过在线样本，但没有一个正是我需要的。基本上我希望能够显示从给定日期过去的天数。我下面的示例是 HTML 和 PHP 的组合，出于某些原因我不得不这样做。 Date
websocket - 现在，Comet是否已被服务器发送的事件和WebSocket淘汰了？
Closed. This question needs to be more focused。它当前不接受答案。想改善这个问题吗？更新问题，使其仅关注editing this post的一个问题。
multithreading - 现在，设置线程关联性而不是将其留给操作系统的充分理由是什么？
在此处搜索“线程关联”的答案，我发现人们对此很感兴趣，但没有什么理由可以节省可能获得稳定的 QueryPerformanceTimer 结果。假设一个现代操作系统和一个现代 2-4 插槽工作站/服务
dart - 现在，使用CoreScaffold和CoreTabs类会导致异常
我有一个称为main-app的聚合物元素:
MySQL:现在()给我零
我有一个表，我想在每个插入时间记录每个订单的时间戳。但是，我得到的时间戳值为零。这是我的架构: CREATE TABLE IF NOT EXISTS orders( orde
mongodb - 现在 Mongoose 无法在编译后覆盖模型
我正在使用 MongoDB Atlas 来托管数据库并使用这个无服务器函数查询数据: import { NextApiRequest, NextApiResponse } from "next"; /
macos - 现在，Apple删除了转义键，使用emacs的策略是什么？
苹果卸下了转义键，并用OLED触摸条替换了它。这对emacs用户具有影响，特别是对于具有数十年肌肉内存力才能克服此变化的UNIX/emacs用户而言。幸运的是，触摸栏逃生键似乎总是在您需要的时候出现，
delphi - 如何在数据库网格中显示TIMEDIFF(现在，然后)？
抱歉，我对 DbGrids 还很陌生。我是否应该使用查询的字段编辑器并以某种方式添加一个捕获 TIMEDIFF 的新字段，然后将其添加为我的 DbGrid 中的列？或者我可以/应该跳过字段编辑器并
unit-testing - 现在，NUnit是否为每个包含的测试方法创建测试夹具类的新实例？
正如一本相当古老的书XUnit Patterns所写，NUnit 2.0不会为每个测试创建新的测试夹具，因此，如果测试正在操纵夹具的某种状态，则该夹具会被共享并且可能导致各种不良副作用。还是一样吗？
android - 现在，Youtube API的配额限制是多少？
我知道自2016年4月以来，Youtube API的默认配额限制为1M。如果要增加它，我们需要向Google 发送请求。我想知道我们可以要求的配额限制的最大值是多少？最佳答案根据Google开
assembly - 现在 x86 上有多少指令？
这个问题不太可能对任何 future 的访客有帮助；它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用，visit the
elasticsearch - 使用范围查询进行搜索时“现在”不起作用
{ "size": 0, "query": { "range": { "LogTime": { "gte": "now-1d",
c - 现在 glibc 中包含数学库了吗？
当我尝试从终端编译这个简单的代码时: #include int main(void) { printf("%f\n",sqrt(10)); return 0; } 使用 gcc mai
java - 现在，我怎样才能从屏幕上抓取这样的html行(使用java)？
我正在尝试筛选抓取一个 html 页面，以便我可以从中提取所需的有值(value)的数据并将其放入文本文件中。到目前为止，一切进展顺利，直到我在 html 页面中遇到了这个: In inventor
MySQL:将所有日期向前移动，因此最大日期=现在
这是我的结果 MySQL 表的示例: 我想将特定用户的所有日期向前移动相同的时间间隔，以便该用户的最高日期是当前时间戳。我知道如何获取以天为单位的间隔: /* result is 823 */ SE
ios - 我在主视图中写了一个函数。现在，我该如何调用它？
我有一个函数需要从主视图中的几个不同位置调用。我们称它为 updateFunction。我这样声明: - (void)updateFunction { //updates some vari
javascript - 嵌套回调 future /现在
我正在尝试找出如何以某种方式嵌套回调。 var alpha = function(callback){ var x = 5; if(x > 2){ callback()
javascript - 函数有效，现在 RangeError
为什么我收到RangeError:超出最大调用堆栈错误？我正在尝试解析文本以找到数学并解决它。它一直有效，直到我开始实现括号'。我试图找出错误，但就是无法弄清楚。我的代码: var alg = {
performance - 现在 SSL 会影响性能吗？
我记得几年前，没有使用 SSL 的原因之一是它占用了大量资源，因此影响了应用程序的性能。如今，以当前的技术，这仍然是一个需要牢记的点吗？这个问题的出现是因为一位同事担心使用 SSL 会影响他的应用
mysql - 现在()与 GetDate()
我正在将我的数据库从 sqlserver 迁移到 mysql当我在 sqlserver 中使用 getDate() 函数时，mysql 中的替换是 Now()但是 Now() 没有返回 getDate

首页

博学

6Ren·AI

商城

java - 现在，我怎样才能从屏幕上抓取这样的html行(使用java)？