gpt4 book ai didi

python - 如何在 Python 中使用 wkhtmltopdf 自定义 Head 和 Proxy?

转载 作者:太空宇宙 更新时间:2023-11-04 05:32:20 24 4
gpt4 key购买 nike

我使用函数 pdfkit.from_url 将 html 转换为 pdf。我想自定义 http head 和代理。我尝试了一些代码,但失败了。

我的代码如下。

#!/usr/bin/env python
# encoding: utf-8


import pdfkit
import requests

url = 'http://www.baidu.com'
headers = {'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/48.0.2564.82 Chrome/48.0.2564.82 Safari/537.36'}
proxy ={'http': '113.119.82.69:9000'}
options = {
'custom-header':headers,
'proxy': proxy
}


pdfkit.from_url(url,'out.pdf',options=options)

最佳答案

命令代码:

# wkhtmltopdf -p proxy target_website output.pdf
wkhtmltopdf -p socks5://192.168.1.100:1080 https://stackoverflow.com output.pdf

python 代码:

import pdfkit

pdfkit.from_url(
output_path='output.pdf',
options={
# proxy ?
# http://user:password@myproxyserver:8080
# '--proxy': 'socks5://192.168.1.100:1080',
'--proxy': 'http://113.119.82.69:9000',
# quiet ?
# '--quiet': ''
},
url='https://stackoverflow.com',
)

关于python - 如何在 Python 中使用 wkhtmltopdf 自定义 Head 和 Proxy?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36723381/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com