gpt4 book ai didi

python - 用于 URL 替换的 pdf-redactor 语法

转载 作者:行者123 更新时间:2023-12-01 08:18:33 25 4
gpt4 key购买 nike

使用https://github.com/JoshData/pdf-redactor如果我提供带有多个 URL 链接的 PDF 并使用示例代码:

options.link_filters = [
lambda href, annotation : "https://www.google.com"
]

效果是将 PDF 中的每个 URL 更改为 https://www.google.com

我怎样才能让它只替换,例如,将 https://www.example.com 替换为 https://www.google.com 并离开其他网址未受影响?

提前非常感谢。

最佳答案

实际上,您可以使用该库中的 lambda 做很多事情。在您给我们的这个特定情况下,您在该函数中插入的任何内容都将具有 https://www.google.com 作为并输出。

但是,如果您想做一些不同的事情,您可以使用 URL (href) 或 annotation(或两者!)作为参数来更改 URL在文件中。我将向您介绍一种可以同时更改多个 URL 的方法:

options.link_filters = [lambda href, annotation: 
'www.google.com' if href == 'www.example.com' else
'www.anything.com' if href == 'www.whatever.com' else
'www.nevermind.com' if href == 'www.bye.com' else href]

在这里,如果您可以将所有出现的 www.example.com 替换为 www.google.comwww.whatever.com对于 www.anything.comwww.bye.com 对于 www.nevermind.com 并保留所有其他 URL。如果您需要使事情变得更加动态,您甚至可以将这些 URL 作为变量传递。

如果您想删除这三个网址之外的所有其他网址(例如,whatever 和 bye.com),您只需将 href 替换为 None 在上面代码的末尾。

嗯,我想我们都同意 pdf_redactor 人员应该花更多的时间来处理文档。 :)

关于python - 用于 URL 替换的 pdf-redactor 语法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54838533/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com