gpt4 book ai didi

pdf - 如何使用 pandoc 设置图像的替代文本以进行 docx 转换

转载 作者:行者123 更新时间:2023-12-04 14:19:04 25 4
gpt4 key购买 nike

导出到 docx 时,pandoc将图像标签设置为其标题。有没有办法设置与标题不同的替代文字?

语境

我们使用 Pandoc 生成要转换为 PDF 的 Markdown 文档。

我安装了 BasicTeX 并使用以下 Markdown 进行了一些测试:

# This is the title

This is a paragraph.

![This is an image](image.jpg)

This is another paragraph.

您可以 download the file here .

使用 Pandoc 转换此代码会导致 this PDF file .

当我在一家无障碍咨询公司工作时,我首先使用 PDF Accessibility Checker 2 检查了 PDF 文件。 ,结果是毁灭性的:

PAC2 results

More results

所以我尝试了一个解决方法 exporting to Microsoft Docx (当使用正确的文档样式时,这是非常容易访问的)。

从那里我使用 AccessPDF 导出到 PDF ,这里是 the resulting PDF file

使用 PAC2 检查时,结果如下:

Results

好多了,但缺少图像的替代文本!所以似乎替代文本被用作 captionfigure (与在 HTML 中完成的方式相同),并且在 HTML 中导出 alt - 标签设置正确,在 Docx 中,替代文本被保留。

我们怎样才能解决这个问题?事实上,当有标题时,图像本身应该 不是 具有与 alt 相同的文本-text 再次,这意味着:它导出到 HTML 的方式并不完美。所以:我们在 Markdown 中有多少控制权来具体指定 captionalt内容?

最佳答案

来自 pandoc readme :

An image occurring by itself in a paragraph will be rendered as a figure with a caption. (In LaTeX, a figure environment will be used; in HTML, the image will be placed in a div with class figure, together with a caption in a p with class caption.) The image’s alt text will be used as the caption.

![This is the caption](/url/of/image.png)


更新:我看到你创建了一个 issue about this .确实,出于某种原因, docx writer currently uses the title text instead of the alt text .不确定这是否是预期行为。同时,您可以使用标题文本,如下所示:
![alt text](foo.jpg "title text")

关于可访问性:pandoc 默认使用 LaTeX(您可以在几个引擎之间进行选择)来生成 PDF,但不幸的是 LaTeX isn't known to generate very accessible PDFs .也许 ConTeXt 更好?
$ pandoc -t context -o mydoc.tex input.md
$ context mydoc.tex

关于pdf - 如何使用 pandoc 设置图像的替代文本以进行 docx 转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35772616/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com