gpt4 book ai didi

java - 将 HTML 实体(如 &)转换为 Latex

转载 作者:行者123 更新时间:2023-12-01 15:10:32 24 4
gpt4 key购买 nike

我正在编写一个应用程序,使用 Java 和 JSOAP 从网站上抓取一些文章。该应用程序将文章的某些部分编译为 .tex ( LaTeX ) 文档,然后使用 PDFLatex 将其转换为 PDF。

某些页面包含 HTML 实体,例如 & 或 ",这些实体会在 PDF 转换过程中导致错误。如何解决此问题?

最佳答案

This question on tex-exchange有一个链接到 neat conversion list 。这些列是(按顺序):

  1. html 实体(忽略大小写),不含 &;
  2. 对应的unicode字符
  3. 相应的 latex 命令(如果可用)。没有 \

以此列表为起点编写一些转换代码应该很容易。

关于java - 将 HTML 实体(如 &)转换为 Latex,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12413024/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com