gpt4 book ai didi

latex - 如何从 LaTeX 文档中提取重要的文本内容

转载 作者:行者123 更新时间:2023-12-02 05:39:06 25 4
gpt4 key购买 nike

我需要从用 LaTeX 编写的论文文档中提取纯文本内容,以进行自动反剽窃检查。我只知道“草稿”选项,但这还不够。

我应该省略:

  • 图像,
  • 表格和其他数字,
  • 方程,
  • 标题和脚注。

最好删除所有引用。输出应该是纯文本(UTF-8 编码)文本文件。

有什么简单的方法可以做到这一点吗?我真的不喜欢手动逐页复制它。

最佳答案

您可以尝试使用注释包(或十几个替代方案之一)将方程、图形、表格等转换为注释环境,并使用\renewcommand\footnote[1]{} 删除脚注。\pagestyle{empty} 应该删除页面标题等,因此在结果上运行 pdftotext 应该接近您想要的结果。

关于latex - 如何从 LaTeX 文档中提取重要的文本内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4837177/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com