- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我希望解析具有相同类的 2 个 div 的网页。
以下是我尝试解析的网页部分:
<div class="bid-row rgray bmatch" id="m590574">
<div class="mtime">12:00</div>
<div class="mteams w240" data-original-title="" title="">
<div class="team">Rayo Vallecano</div>
<div class="team">Malaga CF</div>
</div>
<div class="modds w160">
<div class="clear">
<div class="blank"></div>
<input class="bet" id="q43909084" type="button" value="2.35">
<input class="bet" id="q43909085" type="button" value="3.30">
<input class="bet" id="q43909086" type="button" value="3.15">
</div>
</div>
<div class="minfo">
<div class="stats" data-brid="7610448_1"></div>
<div data-tvinfo="Sky Sports 4, Sport1 HU, LiG TV 3, Canal+ Liga, NTV Plus Futbol 2, TK Futbol 1 UA, Digi Sport 2 RO, CANAL9 DK, Sport Klub 1 SRB, SKY Sport Plus IT HD, Eleven HD" class="fleft tv"></div>
<div class="mlive"></div>
<div class="slider" data-mode="1" data-tid="36" data-cid="32">+50<span class="glyphicon glyphicon-chevron-right"></span></div>
</div>
我正在使用 JSOUP 来解析它,这是我的代码现在的样子:
Elements hrefElements = doc.select("div.bmatch");
DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = docFactory.newDocumentBuilder();
// root elements
org.w3c.dom.Document doc1 = docBuilder.newDocument();
org.w3c.dom.Element rootElement = doc1.createElement("company");
doc1.appendChild(rootElement);
String[] mtime = new String[hrefElements.size()];
String[] team = new String[hrefElements.size()];
String[] tvinfo = new String[hrefElements.size()];
for(int i=0;i<hrefElements.size();i++)
{
mtime[i] = hrefElements.get(i).getElementsByClass("mtime").text();
team[i] = hrefElements.get(i).getElementsByClass("team").text();
tvinfo[i] = hrefElements.get(i).getElementsByTag("div").attr("data-tvinfo");
}
for(int j=0;j<hrefElements.size();j++)
{
// staff elements
org.w3c.dom.Element staff = doc1.createElement("Event");
rootElement.appendChild(staff);
// set attribute to staff element
Attr attr = doc1.createAttribute("id");
attr.setValue("1");
staff.setAttributeNode(attr);
org.w3c.dom.Element firstname = doc1.createElement("Time");
firstname.appendChild(doc1.createTextNode(mtime[j]));
staff.appendChild(firstname);
// lastname elements
org.w3c.dom.Element lastname = doc1.createElement("Teams");
lastname.appendChild(doc1.createTextNode(team[j]));
staff.appendChild(lastname);
// nickname elements
org.w3c.dom.Element nickname = doc1.createElement("TV");
nickname.appendChild(doc1.createTextNode(tvinfo[j]));
staff.appendChild(nickname);
System.out.println("Time: "+mtime[j]);
System.out.println("Event: "+team[j]);
System.out.println("TvInfo: "+tvinfo[j]);
}
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
DOMSource source = new DOMSource(doc1);
String nameGame = jTextField3.getText();
StreamResult result = new StreamResult(new File("test.xml"));
//StreamResult result = new StreamResult(System.out);
transformer.transform(source, result);
// Output to console for testing
// StreamResult result = new StreamResult(System.out);
transformer.transform(source, result);
System.out.println("File saved!");
}
但是,我得到的 HTML 部分的输出如下:
<Event id="1">
<Time>Today12:00</Time>
<Teams>Rayo Vallecano Malaga CF</Teams>
<TV>Sky Sports 4, Sport1 HU, LiG TV 3, Canal+ Liga, NTV Plus Futbol 2, TK Futbol 1 UA, Digi Sport 2 RO, CANAL9 DK, Sport Klub 1 SRB, SKY Sport Plus IT HD, Eleven HD</TV>
</Event>
我想要实现的最终 xml 应该如下所示:
<Event id="1">
<Time>Today12:00</Time>
<Team1>Rayo Vallecano</Team1>
<Team2>Malaga CF</Team2>
<TV>Sky Sports 4, Sport1 HU, LiG TV 3, Canal+ Liga, NTV Plus Futbol 2, TK Futbol 1 UA, Digi Sport 2 RO, CANAL9 DK, Sport Klub 1 SRB, SKY Sport Plus IT HD, Eleven HD</TV>
</Event>
最佳答案
您已使用 hrefElements.get(i).getElementsByClass("team").text();
获取团队名称,它返回所有 macthing 元素的附加文本。在本例中,Rayo Vallecano Malaga CF
代表团队 Rayo Vallecano
和 Malaga CF
。
试试这个。
Elements hrefElements = doc.select("div.bmatch");
DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = docFactory.newDocumentBuilder();
// root elements
org.w3c.dom.Document doc1 = docBuilder.newDocument();
org.w3c.dom.Element rootElement = doc1.createElement("company");
doc1.appendChild(rootElement);
for( int i = 0; i < hrefElements.size(); i++ )
{
// staff elements
org.w3c.dom.Element staff = doc1.createElement("Event");
rootElement.appendChild(staff);
// set attribute to staff element
Attr attr = doc1.createAttribute("id");
attr.setValue("" + (i + 1));
staff.setAttributeNode(attr);
Element timeSection = hrefElements.get(i).select("div.mtime").first(); // one time section
Element teamsSection = hrefElements.get(i).select("div.mteams").first(); // one team section
Element infoSection = hrefElements.get(i).select("div.minfo").first(); // one info section
String time = timeSection.text();
Elements teams = teamsSection.select("div.team"); // many teams within team section
String tvInfo = infoSection.select("div.tv").first().attr("data-tvinfo");
// time element
org.w3c.dom.Element timeElement = doc1.createElement("Time");
timeElement.appendChild(doc1.createTextNode(time));
staff.appendChild(timeElement);
System.out.println(timeElement.getTextContent());
// teams
for(int j = 0; j < teams.size(); j++) {
org.w3c.dom.Element teamElement = doc1.createElement("Team" + (j + 1));
teamElement.appendChild(doc1.createTextNode(teams.get(j).text()));
staff.appendChild(teamElement);
System.out.println(teamElement.getTextContent());
}
// tv info
org.w3c.dom.Element nickname = doc1.createElement("TV");
nickname.appendChild(doc1.createTextNode(tvInfo));
staff.appendChild(nickname);
System.out.println(nickname.getTextContent());
}
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
DOMSource source = new DOMSource(doc1);
StreamResult result = new StreamResult(new File("test.xml"));
transformer.transform(source, result);
System.out.println("File saved!");
关于java - JSOUP从同名的div中获取div内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34246731/
我写了我遇到的问题,但现在我展示了所有代码xml文件 it can't contain other elements it can contain some other elements
我有两个 Controller using Microsoft.AspNetCore.Authorization; using Microsoft.AspNetCore.Hosting; using
我正在尝试保存几个同名的文件。我想做一些名字做这样的事情:file.extension file[1].extension file[2].extension 我试过这个 http://www.nas
我正在尝试创建一个脚本,该脚本将在多个页面上单击相同名称的按钮,但这些按钮具有不同的属性。有些有 id、一些名称、一些值和一些数据作为标识符。这个函数应该有一个属性列表,当我运行脚本时,它应该进入该列
从 Oracle 迁移我想重用一些定义,例如: ALTER TABLE CLIENTUSERS ADD CONSTRAINT UK_CLIENTUSERS_CLIENTUS UNIQUE (CLIEN
我有一个关于 unix 命令行的问题。我有很多这样的文件: /f/f1/file.txt /f/f2/file.txt /f/f3/file.txt and so on. 我想将所有 file.txt
我在表单“delsel2”中有几个复选框(全部具有相同的名称),如下所示: 我希望能够在选择其中任何一个时简单地发出警报,并显示一条消息指示是否选中其中任何一个。 我已经想出了这个,但它不起作用
假设您在子目录 project_1, ..., project_10 中有 10 个项目,它们都在父目录 projects 中。 所有项目都使用相同的库,在 project/project_n/lib
我有一个生成 iOS 框架的 Xcode 项目。我有两个版本的二进制文件要生成 - 一个供内部使用,没有许可要求,另一个供外部使用,但有许可要求。 我想我会为此制定两个目标,并使用不同的 swift
我已经读过有关 jQuery 验证的内容,但我仍然坚持在表单中需要控制数组。 我有这个代码: //already link the validation js script of course
我对这个领域很陌生。我正在尝试阅读一个示例程序。 第一个是team.c #include "support.h" struct team_t team = { "", /* first membe
我有一个包含一组复选框的 HTML 表单: Apple Banana Strawberry 当我单击一个按钮时,我希望将所有选中的同名复选框放在一个数组中。 因此,如果用户选择 Apple 和
我将第一个表存储在数据库中,如图所示,我必须对其应用查询以像第二个表一样显示它 最佳答案 这是使用条件聚合的一个选项: select subject, max(case when exa
对于我文件夹中的每个 mp3 文件,我都有一个同名的 jpg 文件,我试图用 cmd 实现的是将该名称变成一个没有文件扩展名的变量名 这是我只使用 mp3 名称的代码 for %%a in ("*.m
我有 2 个数据库....a 和 b 我在这两个数据库中都有表“t”。 现在我正在从数据库“b”中删除表 t。 我创建了一个 View “t”(请参阅 View 名称与已删除的表相同) 数据库“b
我正在创建一个有特定问题的 SCSS 网格 - 我想使用一个变量名,例如 $pad(用于填充值),但是 $pad变量在不同的媒体断点中需要不同。 首先通过动态创建断点并在其中设置 $pad 值的 mi
一些背景知识: 我正在尝试将我在 Solaris 上运行的一些 .ksh 文件移植到使用 Cygwin 的 Windows 上运行。在 Solaris 机器上运行的 ksh 实现与可在处理子 shel
当执行 tar 提取操作时,有时内容会直接提取到父文件夹,这很糟糕,因为它们变得杂乱无章。例如: tar -xzf foo1.tar.gz 摘录: ./file1 ./file2 ./file3 解决
我想做这样的事情: class X: @classmethod def id(cls): return cls.__name__ def id(self):
我正在看 John De Goes “FP to the Max”视频。在代码中,他做了这样的事情来获取隐式对象: object Program { def apply[F[_]](imp
我是一名优秀的程序员,十分优秀!