作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Mechanize
ruby gem 单击网络上的按钮下载 PDF 文件并将其保存到本地文件系统。
URL = "www.my-site.com"
agent = Mechanize.new
agent.pluggable_parser.pdf = Mechanize::File # FYI I have also tried Mechanize::FileSaver and Mechanize::Download here
page = agent.get(URL)
form = page.forms.first
button = page.form.button_with(:value => "Some Button Text")
local_file = "path/to/file.pdf"
response = agent.submit(form, button)
response.save_as(local_file)
PDF::Reader
阅读此 PDF 文件时gem,我收到错误“PDF 不包含 EOF 标记”。
reader = PDF::Reader.new(local_file) # this also happens if I try to use PDF::Reader.new(response.body) and PDF::Reader.new(response.body_io) depending on the different pluggable_parser configurations mentioned above
#> PDF::Reader::MalformedPDFError: PDF does not contain EOF marker
PDF::Reader
gem 提示它缺少 EOF 标记。
最佳答案
问题似乎与您正在访问的网站有关:http://employmentsummary.abaquestionnaire.org
在响应末尾添加 HTML 数据。
但是,您可以通过搜索第一个子字符串 %EOF
来截断响应。然后删除所有数据。
IE。:
pdf_data = result.body
pdf_data.slice!(0, pdf_data.index("%EOL").to_i + 4)
if(pdf_data.length <= 4)
# handle error
else
# save/send pdf_data
end
关于Ruby - 如何将 EOF 标记添加到 PDF 文件中或以其他方式绕过 PDF::Reader::MalformedPDFError: PDF 不包含 EOF 标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43152017/
我正在使用 Mechanize ruby gem 单击网络上的按钮下载 PDF 文件并将其保存到本地文件系统。 URL = "www.my-site.com" agent = Mechanize.ne
我是一名优秀的程序员,十分优秀!