gpt4 book ai didi

html - A.nnotate.com背后使用了什么技术?

转载 作者:搜寻专家 更新时间:2023-10-31 08:12:16 25 4
gpt4 key购买 nike

我想知道 A.nnotate.com、Scribd、Google Docs 等服务如何将 pdf、.doc 或任何其他文档呈现为 HTML 以及注释系统如何工作?

最佳答案

A.nnotate.com 使用 xpdf 在给定的缩放级别在服务器端将 PDF 页面转换为 PNG 图像 - 这些是在浏览器中显示的内容。

文本突出显示是通过从 PDF 中提取文本位置,然后在页面图像顶部添加透明覆盖,并在单词顶部添加绝对定位的 html DIVS 来完成的。 Annotations 然后使用 ajax gui 将注释附加到突出显示的文本。

其他格式(MS Word、PPT 等)首先使用 openoffice 转换为 PDF,然后像 PDF 一样转换为图像和文本叠加。

我认为其他 HTML 文档站点在将 PDF 呈现为 HTML 方面做了类似的事情(即页面图像 + 文字叠加作为透明 div)——另一种技巧是将 PDF 嵌入字体转换为 HTML5 CSS 字体,并使用绝对定位的 div文本(也提取和定位图像)。

关于html - A.nnotate.com背后使用了什么技术?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6806947/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com