gpt4 book ai didi

pdf - Azure计算机视觉API-OCR转换为PDF文件上的文本

转载 作者:行者123 更新时间:2023-12-04 10:02:57 26 4
gpt4 key购买 nike

我正在尝试利用Computer Vision API对作为扫描文档但被视为图像PDF的PDF文件进行OCR OCR。

我已经对其进行了测试,它告诉我PDF是“InvalidImageFormat”,“输入数据不是有效的图像”。当我在PNG上对其进行测试时,它可以完美运行。

是否有针对PDF图像使用API​​的方法,或者可以结合使用Azure API来使用PDF> PNG>文本?

最佳答案

编辑

由于可以使用其他服务,因此尽管我还没有亲自尝试其中的一些服务,但它们可能适合此目的。

https://docs.microsoft.com/en-us/azure/search/cognitive-search-concept-intro

并在将来的某个时刻发布GA。
https://aws.amazon.com/textract/

原始答案

不幸的是,Azure的Computer Vision API没有PDF集成。若要使用Azure计算机视觉,您需要自己将pdf更改为图像(JPG,PNG,BMP,GIF)。

Google 现在提供pdf集成,到目前为止,从我的测试中我已经看到了一些非常好的结果。

这是通过视觉客户端的asyncBatchAnnotateFiles方法完成的(我一直在使用API​​的NodeJS变体)

它最多可以处理2000页的文件,结果分为20个页面段,并输出到Google Cloud Storage。

https://cloud.google.com/vision/docs/pdf

关于pdf - Azure计算机视觉API-OCR转换为PDF文件上的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52558774/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com