gpt4 book ai didi

ocr - 需要用于打印源代码列表的良好OCR,有什么想法吗?

转载 作者:行者123 更新时间:2023-12-04 03:24:31 25 4
gpt4 key购买 nike

在我的工作中,有时我需要获取一些打印的源代码,然后在文本编辑器中手动键入源代码。不要问为什么。

显然,键入它会花费很长时间,并且总是会花费额外的时间来调试键入错误(糟糕的地方,这里缺少“$”符号)。

我决定尝试一些OCR解决方案,例如:

  • Microsoft Document Imaging-内置了OCR
  • 结果:错过了所有前导空格,错过了所有下划线,错误地解释了许多标点符号。
  • 结论:比手动键入代码要慢。
  • 各种在线Web OCR应用程序
  • 结果:与Microsoft Document Imaging
  • 相似或更差
  • 结论:比手动键入代码要慢。

  • 我觉得源代码将很容易进行OCR,因为字体是无衬线和等宽字体。

    你们中有没有人找到一个可以很好地在源代码上运行的OCR解决方案?

    也许我只需要一个更好的OCR解决方案(不一定是特定于源代码的)?

    最佳答案

    使用OCR,当前有三个选项:

  • Abbee FineReaderOminPage。两者都是商业产品,在功能和OCR结果方面都差不多。关于OmniPage,我不能说太多,但是FineReader确实支持读取源代码(例如,它具有Java语言库)。
  • 最好的OSS OCR引擎是tesseract。它很难使用,您可能需要针对您的语言进行培训。

  • 我很少进行OCR,但我发现在商用软件上花费150美元可以抵消到目前为止所浪费的时间。

    关于ocr - 需要用于打印源代码列表的良好OCR,有什么想法吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1888587/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com