作者热门文章
- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我开始使用 Golang,我想知道是否有办法获取在线 .pdf 文件并提取其中的所有文本.此刻我正在用图书馆做一些测试 docconv它可以很好地处理本地文件,但是当我尝试访问在线文件时,我就是无法获取它,这是我尝试过的方法
第一次尝试
package main
import(
"fmt"
"github.com/sajari/docconv"
"github.com/sajari/docconv/client"
)
func main(){
c := client.New()
res, err := client.ConvertPath(c, "some online url")
if err != nil {
fmt.Println(err)
return nil
}
fmt.Println(res)
}
我也很喜欢其他图书馆,例如 yob/pdfreader和 rsc/pdf但仍然无法正常工作,本地最好的库是 docconv
我们非常欢迎任何有助于实现目标的想法。
谢谢。
最佳答案
检查 code客户端包似乎正在尝试与远程 docconv 服务器通信。为了您的目的,您必须在本地下载一个文件,然后像您一直在做的那样使用该库。 Here您可以查看如何使用 http 客户端下载文件的示例。
关于pdf - 有没有办法使用 docconv 通过网络访问 .pdf 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45466430/
我开始使用 Golang,我想知道是否有办法获取在线 .pdf 文件并提取其中的所有文本.此刻我正在用图书馆做一些测试 docconv它可以很好地处理本地文件,但是当我尝试访问在线文件时,我就是无法获
我是一名优秀的程序员,十分优秀!