- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我有一堆 word 文档 (docx),其中详细说明了作为段落标题的测试用例名称和后续表格中的测试步骤以及一些其他信息。
我需要使用 Apache POI 从表中提取测试用例名称(来自段落)和测试步骤(来自表)。
示例词内容为
Section 1: Index
Section 2: Some description
A. Paragraph 1
B. Table 1
C. Paragraph 2
D. Paragraph 3
E. Table 2
Section 3: test cases ( The title "test cases" is constant, so I can look for it in the doc)
A. Paragraph 4 (First test case)
B. Table 3 (Test steps table immediately after the para 4)
C. Paragraph 5 (Second test case)
B. Table 4 (Test steps table immediately after the para 5)
Apache POI 提供 API 来提供段落和表格列表,但我无法阅读段落(测试用例)并立即查找该段落后面的表格。
我尝试使用 XWPFWordExtractor(读取所有文本)、bodyElementIterator(遍历所有正文元素),但其中大多数都提供了 getParagraphText()
方法,该方法给出了段落列表 [para1, para2, para3, para4, para5]
和 getTables()
方法,将文档中的所有表格作为列表 [table1, table2, table3, table4]
。
我如何遍历所有段落,停在标题“测试用例”(第 4 段)之后的段落,然后查找紧跟在第 4 段之后的表格(表 3)。然后对第 5 段和表 4 重复此操作。
这是 gist link (代码)我试过给出段落列表和表格列表,但不是按照我可以跟踪的顺序。
非常感谢任何帮助。
最佳答案
POI 中的 Word API 仍在不断变化,并且存在错误,但您应该能够通过以下两种方式之一迭代段落:
XWPFDocument doc = new XWPFDocument(fis);
List<XWPFParagraph> paragraphs = doc.getParagraphs();
for (XWPFParagraph p : paragraphs) {
... do something here
}
或
XWPFDocument doc = new XWPFDocument(fis);
Iterator<XWPFParagraph> iter = doc.getParagraphsIterator();
while (iter.hasNext()) {
XWPFParagraph p = iter.next();
... do something here
}
Javadocs 说 XWPFDocument.getParagraphs()
检索在页眉或页脚中保存文本的段落,但我不得不相信这是一个剪切和粘贴错误,因为 XWPFHeaderFooter.getParagraphs()
说了同样的话。查看源代码,XWPFDocument.getParagraphs()
返回一个不可修改的列表,而使用迭代器使段落可修改。这在未来可能会改变,但这是目前的工作方式。
要检索所有正文元素、段落和表格的列表,您需要使用:
XWPFDocument doc = new XWPFDocument(fis);
Iterator<IBodyElement> iter = doc.getBodyElementsIterator();
while (iter.hasNext()) {
IBodyElement elem = iter.next();
if (elem instanceof XWPFParagraph) {
... do something here
} else if (elem instanceof XWPFTable) {
... do something here
}
}
这应该允许您按顺序遍历所有正文元素。
关于java - Apache POI : Extract a paragraph and the table that follows from word document (docx) in java,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37599003/
我正在尝试计算 iFrame 的高度,但不明白为什么 document.body.offsetHeight + document.body.bottomMargin 不等于 document.docu
我正在使用 Node/Mongoose/MongoDB 并尝试构建一个轮询应用程序。一个关键需求是跟踪单个用户对同一民意调查的响应如何随时间变化(他们一遍又一遍地进行同一民意调查)。 我有一个用户模型
首先,我不是普通的博主,我很困惑。如果我的问题不符合要求,请指导我。我会努力改进的。 我已提交 Microsoft Code Review 的 Microsoft CRM 插件。我是 JavaScri
谁能解释为什么使用类似的东西: gci -force "\\computername\c$\users\username\Documents" -recurse 或者 gci -force "\\co
It's difficult to tell what is being asked here. This question is ambiguous, vague, incomplete, over
这个问题已经有答案了: What is the (function() { } )() construct in JavaScript? (28 个回答) 已关闭 6 年前。 说实话,一开始我以为我可
document.getElementsByTagName("*") 适用于 IE/Firefox/Opera,但不适用于 Chrome 和 Safari。 document.all 适用于 IE/C
这个问题在这里已经有了答案: What is the difference between Document and document in JavaScript? (2 个答案) 关闭 8 年前。
我以某种方式发现将事件监听器添加到文档的行为有点奇怪。虽然向 HTMLElements 添加监听器工作正常,但向文档添加监听器不起作用。但奇怪的是,使用 jQuery 可以让它工作。 那么有人可以解释
谁能告诉我这两个 JavaScript 命令之间的区别? 这两个跨主要浏览器的兼容性是什么?我知道 documentElement 与大多数浏览器兼容。 谢谢 最佳答案 document.docume
什么时候应该使用 document.all 与 document.getElementById? 最佳答案 document.all 是 Microsoft 对 W3C 标准的专有扩展。 getEle
当升级到 react-native 0.61.2 时,这个问题出现了。我做到了从手机中删除了 apk 和自动链接使用 react-native link 然后 react-native run-and
当升级到 react-native 0.61.2 时,这个问题出现了。我做到了从手机中删除了 apk 和自动链接使用 react-native link 然后 react-native run-and
我将收到 tungstenite::Message ,它将包含来自客户端的bson文档。我可以将tungstenite::Message转换为Vec,但是如何在服务器端将其转换回 bson::docu
我这里有一个简单的疑问: 文档对象范围位于浏览器选项卡内:我的意思是如果我设置document.tab1 ='tab1' 在一个浏览器选项卡中 它在其他选项卡中不可用。 但是 document.coo
我经常使用并看到推荐的 dom 访问结构,例如这样动态地将内容添加到页面: loader = document.createElement('script'); loader.src = "myurl
我对 JQuery 还很陌生。我正在使用this JQuery 函数在元素上显示工具提示。 我根据我的需要(在这个社区的帮助下)以这种方式编辑了代码: $(document).ready(functi
我想知道哪个是运行js代码的正确方法,该代码根据窗口高度计算垂直菜单的高度并按时设置,不晚不早。 我正在使用 document.ready 但它并没有真正帮助我解决这个问题,它有时没有设置,我必须重新
我正在浏览一个 js 文件并发现这个声明var dataobj=document.all? document.all.id_name : document.getElementById("id_nam
想知道何时使用,这适用于什么浏览器? if (document.all&&document.getElementById) { // Some code block } 最佳答案 我认为没有任何重要的
我是一名优秀的程序员,十分优秀!