gpt4 book ai didi

javascript - 是否有 npm 包或 web api 用于读取图像的特定部分?

转载 作者:行者123 更新时间:2023-12-02 22:45:33 25 4
gpt4 key购买 nike

我正在向我的 Node Express 服务器添加一个新功能,该功能将允许我上传驾驶员 ELD 每日日志,并从该图像/pdf 中获取驾驶时间、开始时间、结束时间、午餐等。

Demo Log

我正在考虑将 pdf 转换为 csv/json/html,但问题是它是一个未标记的困惑。所以我想尝试以某种方式读取并创建一个与现场日志上已有的图表类似的图表。

即。读取它会以 15 分钟或任意像素为单位进行分段。

Area of focus

IF行存在于段中,调用继续并记录数据ELSE检查段“SB”“D”“ON”然后递归调用

Semented area of focus

在上面的示例中,该司机于早上 6:45 上类。

这些文件以 pdf 格式提供,我在提取数据并使其有用/标记时遇到问题。

更新:再考虑一下,这个解决方案可能会消耗相当大的资源,特别是如果在服务器端完成,即。切碎图像/将其留在缓冲区中并读取它...也许最好尝试理解从 pdf 到其他内容的垃圾解析...

更新2:我可以尝试使用Tesseractocr取决于它如何输出数据。

在这样的页面上使用:

Demo Page 2 ELD Log

最佳答案

我认为您正在寻找的术语是OCR(光学字符识别)。这就是将图像上的文本转换为实际文本以供使用的技术的名称。一旦掌握了这一点,如果文本是标准格式的话,解码文本应该很容易。 Node 有很多 OCR 库:https://www.npmjs.com/search?q=OCR无需重新发明轮子并尝试构建自己的 OCR 系统:)

关于javascript - 是否有 npm 包或 web api 用于读取图像的特定部分?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58419444/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com