gpt4 book ai didi

ruby - PDF 阅读器 ruby​​ gem landscape Page

转载 作者:太空宇宙 更新时间:2023-11-03 16:49:53 24 4
gpt4 key购买 nike

我正在尝试使用 Pdf-reader ruby​​ gem ( https://github.com/yob/pdf-reader/ ) 将 pdf 转换为纯文本

它适用于纵向页面,但不适用于横向页面

当我试图以随机顺序将其阅读内容转换为纯文本的横向页面时,我也丢失了一些纯文本数据

横向页面属性如下

{:Parent=>#<PDF::Reader::Reference:0x000000062d4e60 @id=11481, @gen=0>, :Type=>:Page, :Resources=>{:Font=>{:Fcpdf0=>#<PDF::Reader::Reference:0x000000062cfc80 @id=8585, @gen=0>, :Fcpdf2=>#<PDF::Reader::Reference:0x000000062cef10 @id=8588, @gen=0>, :Fcpdf3=>#<PDF::Reader::Reference:0x000000062cec18 @id=8590, @gen=0>}, :ProcSet=>#<PDF::Reader::Reference:0x000000062cdca0 @id=4, @gen=0>}, :MediaBox=>[0, 0, 595.276, 841.89], :CropBox=>nil, :Rotate=>90, :Contents=>[#<PDF::Reader::Reference:0x000000062c6c70 @id=15, @gen=0>, #<PDF::Reader::Reference:0x000000062c6a18 @id=16, @gen=0>]} 

肖像页面的属性如下

{:Parent=>#<PDF::Reader::Reference:0x000000062fadb8 @id=11481, @gen=0>, :Type=>:Page, :Resources=>{:Font=>{:Fcpdf0=>#<PDF::Reader::Reference:0x000000062f9be8 @id=8585, @gen=0>, :Fcpdf2=>#<PDF::Reader::Reference:0x000000062f8c48 @id=8588, @gen=0>, :Fcpdf1=>#<PDF::Reader::Reference:0x000000062f8748 @id=8587, @gen=0>, :Fcpdf4=>#<PDF::Reader::Reference:0x000000062f3b30 @id=8592, @gen=0>}, :ProcSet=>#<PDF::Reader::Reference:0x000000062f3630 @id=4, @gen=0>}, :MediaBox=>[0, 0, 594, 792], :CropBox=>[0, 0, 594, 792], :Rotate=>0, :Contents=>[#<PDF::Reader::Reference:0x000000062f05e8 @id=9, @gen=0>, #<PDF::Reader::Reference:0x000000062f02c8 @id=10, @gen=0>]} 

我正在阅读 pdf 作为:

reader = PDF::Reader.new("sample.pdf")

page = reader.pages[page_no]

puts page.text

所以谁能帮我把横向页面转换成纯文本。

最佳答案

尝试设置方向

reader = PDF::Reader.new("sample.pdf",{:orientation => :landscape}) 

关于ruby - PDF 阅读器 ruby​​ gem landscape Page,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24690924/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com