gpt4 book ai didi

apache-poi - 如何使用apache poi从java中的docx中删除包含数据的表格和段落

转载 作者:行者123 更新时间:2023-12-02 21:33:05 24 4
gpt4 key购买 nike

我有一个 Word 模板,其中包含多个相似的表格以及与这些表格关联的一些段落。根据数据量,我填充了一些表,其他的不需要,所以有段落。

my_img

我需要删除这些表格和段落。正如您在图片中看到的,我需要删除表 2 及其段落 Table Parahgraph

请帮我看看该怎么做。我尝试使用 document.removeBodyElement(pos) ,但没有帮助。

int startIndex = 0;
int endIndex = 0;
startIndex = doc.getPosOfTable(doc.getTables().get(0));
startIndex++;
endIndex = doc.getPosOfTable(doc.getTables().get(1));
System.out.println("startIndex "+ startIndex);
System.out.println("endIndex "+ endIndex);

for(int i=startIndex; i<=endIndex; i++){
doc.removeBodyElement(i);
}

最佳答案

问题在于使用removeBodyElement会移动其余元素并重新计算它们的索引。这意味着,如果您想删除元素#4到#6(包括两个表之间的空段落),那么在删除元素#4(空行)后,这是您的第二个表(而不是其标题段落)将成为元素#5等。基本上,这个循环会跳跃两个元素(i+=2而不是i++),从而删除只删除了你想要的一半,甚至删除了你不想删除的内容。

因此,您只需反转循环的顺序:

for ( int i = endIndex; i >= startIndex; i-- ) {
System.out.println( "removing bodyElement #" + i );
document.removeBodyElement( i );
}

我已经用模板对其进行了测试,与您的示例类似,它工作正常!希望对您有所帮助。

关于apache-poi - 如何使用apache poi从java中的docx中删除包含数据的表格和段落,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21968813/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com