Python - pdfkit 的超时规则-6ren

Python - pdfkit 的超时规则

转载作者：行者123 更新时间：2023-12-05 07:37:52

29

4

我想知道是否有人知道如何在运行 pdfkit 时实现超时？

我正在尝试遍历大量 URL 以打印每个 URL 页面的 pdf。有时循环可能会挂起，但是如果它花费超过 30 秒，我只想跳过循环中的 URL。我试过:

for n, i in enumerate(urllist):    
    pdfkit.from_url(i, str(directory) + "\\" + str(idnum[n]) + ".pdf", configuration=config, timeout=30)

上面的代码只是立即结束了循环。这段代码在没有“超时”部分的情况下工作得很好，但是运行 10 个 URL 需要大约 4 分钟(我需要超过 10,000 个)

最佳答案

Pdfkit 是 wkhtmltopdf 的包装器，这通常是 pdfkit 在加载页面或其他内容时挂起的原因。不幸的是 wkhtmltopdf 还没有超时(more here)并且 pdfkit 也没有解决这个问题(more here)。所以，不，你不能使用 pdfkit 或 wkhtmltopdf 的内部超时。

为了在Windows 中解决这个问题(LINUX 有更好的解决方案)我使用了multiprocessing 包。请注意，此代码是更大代码的一部分，尚未按原样进行测试。如果它不起作用，请留下反馈:)

import pdfkit, multiprocessing

url = "a_url"

p = multiprocessing.Process(target = pdfkit.from_url, args = (url, pdf_name,)) # Create the process
p.start() # Start the process
p.join(180) # Give it a 180 sec frame to complete before you kill it
if p.is_alive():
    p.terminate() # If after 180 sec its still running, kill it

# Note that if it completes before 180 sec, the script continues (you don't wait 180 sec)
# Note that if you run pdfkit from another function declared in the script you might have problems with multiprocssing. Multiprocssing requires sometimes that functions are imported... for some reason. Just create another file and import it.

运行 1150 个 4 页 pdf 后，我没有观察到内存或 CPU 有任何显着变化

多处理有点像重甲，但我尝试过的其他方法都不起作用。 stopit由于某种原因无法停止该过程。signal 在 Windows 中不起作用。

关于Python - pdfkit 的超时规则，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48345160/

29

4

0

文章推荐： WiX 3.11.1——错误 LGHT0103 : The system cannot find the file

文章推荐： node.js - 以太坊错误 : Transaction was not mined within 50 blocks

文章推荐： amazon-athena - Apache 超集 : cannot read metadata from Athena

文章推荐： javascript - 获取 contenteditable 中发生 keydown 的元素

kubernetes - CORS 规则 nginx-ingress 规则
我需要在 nginx-ingress 版本上允许来自多个来源的请求:http://localhost:4200、http://localhost:4242 等1.7.1.但我无法对多个来源执行此操作，
apache - htaccess 规则 (mod_rewrite) 转换为 web.config 规则
我正在部署我使用 APIGILITY 开发的 API到 IIS。由于 IIS 不支持 .htaccess，我试图从 .htaccess 文件的内容创建 web.config 文件。我使用 IISv7.
"google' s 检查元素上的 html 规则 VS css 规则”
我正在尝试更改上面 css 样式中的“宽度”规则。在“inspect element”中你可以看到宽度是1008px。我不希望它是 1008px 但它不会让我在 css 样式中更改它你可以看到它被“删
css - 每个 html 元素的 css 规则 VS 每个元素的几个简单的 css 规则？
外部css赋值有2种方法，我用的是第一种；大多数网站使用第二种方法。我想知道我是否做错了! 第一种方法: 为几乎每个 css 规则创建一个类并在任何地方使用它们。 blah blah .f_
03、RDF 规则
RDF使用 WEB 标识符 (URIs) 来标识资源，使用属性和属性值来描述资源 RDF 资源、属性和属性值 RDF使用 WEB 标识符来标识事物，并通过属性和属性值来描述资源。关于资源、属性
R 规则，仅我的规则来自特定列
我想挖掘特定的 rhs 规则。文档中有一个示例证明这是可能的，但仅适用于特定情况(如下所示)。先来一个数据集来说明我的问题: input {b=100002} 0.2500000 0.250000
服务根的 nginx 规则
我想让 nginx 从网站根目录(:http://localhost:8080/)提供一个静态文件，但它为我的代理通行证提供服务；它提供“/”规则而不是“=/”。这是我的 nginx 配置的样子:
具有用于单次调用的多个目标的 Makefile 规则
根据gnu make documentation , 如果一个规则通过一次调用生成多个目标(例如，一个配方执行一个带有多个输出文件的工具)，你可以使用 '&:' 规则语法来告诉 make。但是，当在多
Firebase 规则 : What is . 包含()？
我已阅读Firebase Documentation并且不明白什么是 .contains()。以下是文档中 Firebase 数据库的示例规则: { "rules": { "rooms"
haskell - 函数内的格式化语句 - 规则？
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 6 年前。 Improv
java多态后期绑定(bind)规则
我正在尝试做一些多态性练习，但我无法弄清楚这种多态性是如何工作的。我没有找到任何关于这种练习的深入信息。希望大家能给我一些解释。练习1: class Top { public void m(
保留中间文件的 Makefile 规则
为了调试复杂的 XSLT 转换，我将其分为几个部分:首先构建 %.1.xml，然后使用它构建 %.2.xml ，最后构建 %.3.xml。一切正常，但如果我要求 Make 构建最后一个，Make 总是
python - 如何添加验证特征/规则？
我尝试了 hacerrank 的 slove 练习 Click我不知道如何添加这些规则: ► 它可以包含 4 个一组的数字，并用一个连字符“-”分隔。 ► 不得有 4 个或更多连续重复数字。这是我的
c# - 我如何使声明遵循与以前相同的 "if"规则
我正在尝试编写一个小测验，我希望“再试一次”按钮遵循与“else”之前的“if”语句相同的规则 using System; public class Program { public stat
java - Spring服务方法和复杂的验证逻辑/规则
在我的 Spring/Boot Java 项目中，我有一组服务方法，例如以下一个: @Override public Decision create(String name, String descr
协变虚函数的 C++ 规则
我正在阅读 Covariant virtual function .上面写着假设 B::f 覆盖了虚函数 A::f。如果满足以下所有条件，A::f 和 B::f 的返回类型可能不同: 1) The
iOS 企业开发者计划 - 规则
我工作的公司想要分发(在公共(public)链接中)具有内部签名的应用程序。我很确定 Apple 否认这种事情，但我在官方文档/契约(Contract)中没有找到任何相关信息。有谁知道它到底是如何工
页面加载时不应用 css 规则
我是 CSS 新手。我观察到一个奇怪的 CSS 行为，其中一个元素具有以下 CSS 属性 .container .header{ color: #FFFFFF; font-size: 2em;
基于内容的 CSS 规则
这个问题在这里已经有了答案: Is there a CSS selector for elements containing certain text? (21 个答案) 关闭 7 年前。
不应用 CSS 规则
我有以下 CSS: workoutcal.css: .errorlist{ color:red; } 以下基本模板: base.html: {% load static %} {

首页

博学

6Ren·AI

商城

Python - pdfkit 的超时规则