- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Apache POI 将带有 Latex 样式方程的文本转换为 MS Word 文档。在一些帮助下,我能够成功地实现它,但如果该行有多个方程,那么它会产生错误的结果。
以下是我的代码:
import java.io.*;
import org.apache.poi.xwpf.usermodel.*;
import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTP;
import org.openxmlformats.schemas.officeDocument.x2006.math.CTOMath;
import org.openxmlformats.schemas.officeDocument.x2006.math.CTOMathPara;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.stream.StreamSource;
import javax.xml.transform.stream.StreamResult;
import uk.ac.ed.ph.snuggletex.SnuggleInput;
import uk.ac.ed.ph.snuggletex.SnuggleEngine;
import uk.ac.ed.ph.snuggletex.SnuggleSession;
import java.io.IOException;
public class CreateWordFormulaFromMathML {
static File stylesheet = new File("MML2OMML.XSL");
static TransformerFactory tFactory = TransformerFactory.newInstance();
static StreamSource stylesource = new StreamSource(stylesheet);
static CTOMath getOMML(String mathML) throws Exception {
Transformer transformer = tFactory.newTransformer(stylesource);
StringReader stringreader = new StringReader(mathML);
StreamSource source = new StreamSource(stringreader);
StringWriter stringwriter = new StringWriter();
StreamResult result = new StreamResult(stringwriter);
transformer.transform(source, result);
String ooML = stringwriter.toString();
stringwriter.close();
CTOMath ctOMath = CTOMath.Factory.parse(ooML);
return ctOMath.getOMathArray(0);
}
public static void main(String[] args) throws Exception {
XWPFDocument document = new XWPFDocument();
String mstr = "The expression is as: $ax^2 + bx = c$ is easier to understand than $$ax^2 + \\frac{\\sin^{-1}\\theta}{\\cot{-1}} \\times y_1$$ or anything in \\[ ay^2 + b_2 \\theta\\]";
XWPFParagraph paragraph = document.createParagraph();
XWPFRun run = paragraph.createRun();
// run.setText("");
SnuggleEngine engine = new SnuggleEngine();
SnuggleSession session = engine.createSession();
SnuggleInput input = new SnuggleInput(mstr);
session.parseInput(input);
String mathML = session.buildXMLString();
System.out.println("Input " + input.getString() + " was converted to:\n" + mathML + "\n\n");
for(String s : mathML.split("\\s+(?=<math)|(?<=</math>)\\s+")){
if (s.startsWith("<math"))
{
CTOMath ctOMath = getOMML(s);
System.out.println(s);
CTP ctp = paragraph.getCTP();
ctp.setOMathArray(new CTOMath[]{ctOMath});
}
else
{
run.setText(s + " ");
System.out.println(s);
}
}
document.write(new FileOutputStream("CreateWordFormulaFromMathML.docx"));
document.close();
}
}
这会生成一个带有
的文档表达式为:比 ay^2+b_2\theta 中的 或 更容易理解
注意:(ay^2+b_2\theta) 在字方程格式中是正确的。
我需要的是中间有多个方程的内联文本。
最佳答案
如何解决创建任务Office OpenXML
文件如*.docx
?
Office OpenXML
文件如*.docx
很简单ZIP
文件。我们可以解压它们并查看内部结构。在 *.docx
我们发现/word/document.xml
在那里我们找到XML
它描述了文档结构。对于具有内联公式的段落,我们发现类似:
<w:p>
<w:r>
<w:t>text</w:t>
</w:r>
<m:oMath>... </m:oMath>
<w:r>
<w:t>text</w:t>
</w:r>
<m:oMath>... </m:oMath>
...
</w:p>
所以我们需要多次运行来保存文本,并且在它们之间有多个 <m:oMath>... </m:oMath>
.
这就是为什么该段落有 OMathArray
CTOMath[]
。并且您的代码确实使用具有 one CTOMath
的新数组覆盖此数组。 每次额外 CTOMath
被找到。相反,额外的 CTOMath
需要添加到数组中,每次追加CTOMath
被发现了。
了解我们可以用org.openxmlformats.schemas.wordprocessingml.x2006.main.CTP
做什么段落,我们需要为此提供文档。我发现的最好的是grepcode.com 。在那里我们找到CTP.addNewOMath()和 CTP.setOMathArray(int, CTOMath) .
因此更改您的代码:
for(String s : mathML.split("\\s+(?=<math)|(?<=</math>)\\s+")){
if (s.startsWith("<math")) {
CTOMath ctOMath = getOMML(s);
System.out.println(s);
CTP ctp = paragraph.getCTP();
ctp.addNewOMath();
ctp.setOMathArray(ctp.sizeOfOMathArray()-1, ctOMath);
}
else {
run = paragraph.createRun();
run.setText(s + " ");
System.out.println(s);
}
}
应该可以。
关于java - 如何在 Apache POI Word 中添加与文本内联的多个方程?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46644488/
如何将扩展名为 ttf 和 otf 的新字体导入 POI API,而不将这些字体安装到环境中? Is there a jar that i should update it with the path
在这个问题的所有引用资料中,它没有解决并且不给maven因为没有在maven中做。错误是 包 org.apache.poi.ss.usermodel 可以从多个模块访问:poi、poi.ooxm在
上下文: 尝试使用 Apache POI 的 poi 和 poi-ooxml 4.0.0 版本 jar 打开 XLSX 文件 问题: 程序抛出错误,如下所示。当我使用 4.0.0 版本时,我发现此错误
刚开始使用 POI 3.10 创建 Word 文档(XWPF)。 大多数事情都是直截了当的,但我不明白如何添加页码。 我添加了页脚,但页脚中的文字在每一页上都相同 最佳答案 我在 LibreOffic
我正在使用 Apache POI 评估工作簿的每个公式单元格。当一个单元格包含对标准 excel 函数 NOW() 的调用时,Poi 会正确评估它并将调用替换为当前时间 - 格式为 VM 的默认时区。
我已经阅读了许多与我的要求相关的博客和论坛,但到目前为止,我能够在我得到的所有帮助下为第一级生成项目符号或编号。谁能指导我如何使用 apache poi 创建多级编号。 想知道 Apache POI
我正在使用 apache poi 创建 Excel 工作表。我有像 - 337499.939437217 这样的数字,我想在 Excel 中显示它,而不进行四舍五入。此外,单元格格式应为数字(对于某些
情况是,我合并了第一行的所有五个单元格,并在第一行的第一个单元格中插入了一个图像。我的要求是使图像在第一行水平居中。 我试过 cellStyle.setAlignment(CellStyle.ALIG
我正在尝试替换模板 DOCX使用 Apache 的文档 POI通过使用 XWPFDocument类(class)。我在文档中有标签和 JSON文件以读取替换数据。我的问题是 DOCX 中的文本行似乎以
好吧,老实说:标题并没有说出全部真相。我正在使用带有多个按钮(保存、关闭、编辑等)和一个执行 POI 操作的按钮的自定义控件 - 它生成一个 Word 文件。 我在这里遇到一个问题:点击 POI 按钮
有什么方法可以让我获得 excel 连续显示的格式化值,而不是我从流中返回的原始值? 或者这是否属于“公式评估”类别,这不支持? 最佳答案 如果您有 Cell您正在尝试从中获取数据,请尝试以下操作 D
在 xlsx 工作簿中,有一些单元格带有一些无界 SUMIF 公式,如下所示:SUMIF(MySheetname!$B:$B,$E4,MySheetname!$I:$I) . 使用 Apache PO
我正在创建一个 Java 程序来读取 Excel 工作表并创建一个逗号分隔的文件。当我运行带有空白列的示例 excel 文件时,第一行工作正常,但其余行跳过空白单元格。 我已经阅读了将空白单元格插入行
我目前正在使用 POI 使用 XSLF 编辑 PPTX 文件内嵌入图表中的数据。我找到了一个使用带有饼图的模板 ppt 的示例,效果非常好。我还尝试编辑折线图并且它有效。但是,当我尝试编辑嵌入式条形图
我正在学习使用 Selenium 和 Excel 进行数据驱动测试。我正在参加一门在线类(class),要求在 Maven 中添加 Apache poi 和 poi-ooxml 依赖项。 我正在努力理
我们有一个具有画廊功能的应用程序,我们想将图像导出到 powerpoint 演示文稿中。我能够做到这一点,但由于图像的大小和方向不同,图像边界几乎总是超出 ppt 幻灯片。我如何调整图像的大小(我不想
我有一个带有以下幻灯片布局的 pptx: System.out.println("Available slide layouts:"); for(XSLFSlideMaster master
我正在尝试使用 Java 中的 POI api 创建 Excel 工作表。在那个 Excel 工作表中,我想要一个只有 TIME 的单元格。通过设置它,我们可以像在数字列中那样将单元格包含在该特定列的
Apache Poi 可以计算和返回公式中函数的结果。但是对于特殊函数 HYPERLINK(),它只返回“显示值”,而不是实际计算的超链接值。 我有一个 Excel 文件,其中包含复杂的计算超链接,这
我正在使用 Apache POI。 我可以使用“org.apache.poi.hwpf.extractor.WordExtractor”从文档文件中读取文本 甚至使用“org.apache.poi.h
我是一名优秀的程序员,十分优秀!