- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的任务是从定期更新的在线表格中获取定价信息。具体来说,以粗体列出的商品表示最近更新过价格的商品。我主要负责这些,并将这些元素的信息转移到公司的数据库中。但是,我对在 Java 中使用 HTML 表格有点陌生,并且不确定如何准确过滤粗体项目。我确实注意到他们周围有“强”标签;我只是不确定如何使用它。我已经尝试过广泛地谷歌搜索,但我发现的几乎所有问题都是关于写入 HTML 表而不是从中读取。我发现与我的问题相关的是很多使用 Jsoup 或 jQuery 的建议。这些对于我想做的事情来说是必要的吗(或者至少让它变得更容易)?
这是我迄今为止为其中一个表编写的代码(如果有帮助的话),尽管它当前所做的只是显示整个表的 HTML。
package cmtabacosPrecios;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URL;
public class CeutaYMelilla_Cigarillos {
public static void main(String[] args) throws Exception {
// Run the getHTML method
try {
getHTML("http://www.cmtabacos.es/wwwcmt/listaPrecios.php?&zona=cm&labor=cillos&mostrar_codigo=S");
}
catch (Exception ex) {
System.out.println("Error. Exception has occured.");
}
}
// The getHTML method
public static String getHTML(String URLToRead) throws Exception {
URL cmtabacosPrecios = new URL(URLToRead);
BufferedReader in = new BufferedReader(
new InputStreamReader(cmtabacosPrecios.openStream()));
String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
// Return HTML as a String
return inputLine;
}
}
最佳答案
下面是使用 jsoup 从表中检索数据的示例代码。只需修改它即可获取对您重要的数据。您还可以通过 project website 了解有关 jsoup
的更多信息。它非常简单且功能强大。
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws IOException {
Document doc = Jsoup.connect("http://www.cmtabacos.es/wwwcmt/listaPrecios.php?&zona=cm&labor=cillos&mostrar_codigo=S").get();
Elements tableRows = doc.select("tr");
for (Element row : tableRows) {
Elements marca = row.getElementsByClass("marca");
Elements pvpExp = row.getElementsByClass("pvp_exp");
Elements pvpPvr = row.getElementsByClass("pvp_pvr");
if (!marca.isEmpty() && !pvpExp.isEmpty() && !pvpPvr.isEmpty()) {
System.out.println(marca.get(0).text());
System.out.println(pvpExp.get(0).text());
System.out.println(pvpPvr.get(0).text());
}
}
}
}
关于Java-获取 HTML 中的粗体文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24181535/
程序集,masm 嘿,我写了宏来打印存储在 dane1 段中的 1 字节值。 我将值除以 16,然后将提醒推送到堆栈,直到值==0。然后我弹出提醒将它们转换为 ASCII 码,并打印它们。 有人可以看
我在 Apache Geronimo 2.1.3 上有一个 Web 服务应用程序。 我正在使用 JAX-WS,使用 SOAP 1.1 注释 POJOS。 (使用 Sun JDK 1.5) 各种客户端都
我有一个数据变量,monthArray,它被多个消费者读取,并由单个定期更新程序线程定期更新数据。全部异步。 我已经考虑了这两个选项来安全地执行更新。 ArrayList tempArray
我有一组 3D 体。每个 Body 由 8 个点定义,每个点具有三个坐标。所有的物体都是立方体的或近似立方体的。我想用系统的点栅格“填充”立方体。坐标存储在简单的 data.frames 中。 我开发
我正在处理遗留代码,需要打补丁。 问题:一个古老的应用程序发送错误的 HTTP POST 请求。其中一个参数未经过 URL 编码。我知道这个参数总是排在最后而且我知道它的名字。我现在正尝试在运行在 t
我想在触摸屏幕时移动 sprite body ,但它不能发生...... -(void)ccTouchEnded:(UITouch *)touch withEvent:(UIEvent *)event
这个问题在这里已经有了答案: Can a union be initialized in the declaration? (3 个答案) 关闭 7 年前。 如果它是一个struct那么它就可以完成
我正在尝试获取生成 sigsys 信号的系统调用的地址!但我从 gcc 收到以下错误: gcc emulator.c -fms-extensions error: ‘siginfo_t’ has no
当我使用 Postman 进行 API 调用时,我收到一个 JSON 对象..这是我所期望的。 但是,当我像这样与 Guzzle 进行相同的调用时: $client = new \GuzzleHttp
在编码时,出现了差异。通常在编写简单的方法或构造函数时,我经常使用表达式体技术。但是,当我产生以下内容时: public class Sample : ISample { private r
我正在使用 LibGDX 创建一个新项目。 我想做的是,我将 tmx 文件中的主体加载到工作正常的关卡中。尸体也有一个 Sprite 。 问题是,我想让用户触摸场景中的某些 body 。当他们触摸 b
我的意图:在不使用 union 的情况下循环遍历一个结构的 30 个成员,所有成员都是字符数组类型,每个成员都存储对 itoa 的调用结果。在下面的代码中,我将结构体成员命名为a-z、A-D。在调用函
我必须将我的代码段之一从 C 转换为 java。代码如下。 union commandString{ char commndStr[20]; struct{ char
#include union NumericType { float value; int intvalue; }Values; int main() { Values.va
我在此代码中收到错误: fun num(num:Int):Int { if (num > 0){ print(num % 10) return num / 10
我是一名优秀的程序员,十分优秀!