gpt4 book ai didi

javascript - 如何从网页中的嵌入式pdf中获取选定的文本?

转载 作者:搜寻专家 更新时间:2023-10-31 23:05:16 24 4
gpt4 key购买 nike

这是一个 pdf 文档的示例,我需要从中提取用户的选择 http://www.ada.gov/hospcombrprt.pdf .如果我们查看页面源代码,我们会看到如下内容:

<html>
<body marginwidth="0" marginheight="0" style="background-color: rgb(38,38,38)">
<embed width="100%" height="100%" name="plugin"
src="http://www.ada.gov/hospcombrprt.pdf" type="application/pdf">
</body>
</html>

我们如何从这个嵌入的 pdf 中获取用户的选择?

我找到了一篇关于从 pdf 文档中提取整个文本的帖子 here和我的帖子相似 here上面写着没有这种可能性。

但应该有一些出路。也许可以提取整个文本,然后以某种方式确定已选择的内容?或者通过鼠标光标在鼠标按下和向上事件上的位置来确定选择?将不胜感激任何想法。

最佳答案

我怀疑这是可能的 - 如果是的话,将没有通用的解决方案,因为每个 PDF 查看器都是不同的。

并不是每个人都使用 Adob​​e 自己的 Acrobat 插件。福昕很受欢迎。这两个都是很可能不提供访问此信息的接口(interface)的插件。

Chrome 和 Firefox 等一些浏览器现在提供内置的 PDF 查看器,其工作方式与插件完全不同。

此外,您是否正在访问不同域中的 PDF?在那种情况下,同源策略无论如何都会阻止访问此类信息。

最后,您需要考虑并非每个用户都喜欢使用(甚至被允许使用)PDF 浏览器插件,因此您的“解决方案”在这些情况下不起作用。

还有一点:您使用的是非常过时的 embed 元素而不是 object 这一事实表明您正在使用非常古老的知识。

您可能需要退后一步,真正重新考虑您在这里尝试做的事情。更大的图景是什么?你想达到什么目的?

关于javascript - 如何从网页中的嵌入式pdf中获取选定的文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19765844/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com