gpt4 book ai didi

java - OCR 中的滑动窗口需要很多时间

转载 作者:行者123 更新时间:2023-11-29 03:40:03 25 4
gpt4 key购买 nike

我正在实现滑动窗口技术来开发照片 OCR,即从图片上切下一个特定大小的矩形并检查它是否包含文本。然后矩形再次移动一些像素。但是这种滑动窗口技术要花费很多时间。例如,处理一张 1366x768 的图片需要 6 个小时,步长为 2,窗口大小为 20x25。是否有任何其他可能有用的技术或如何加快该过程?

我正在用 java 编写代码。

最佳答案

如果不知道你的算法/代码的任何细节,很难给出具体的建议。您可以考虑几个潜在的性能改进:

  1. 尽量减少磁盘 I/O 和缓存未命中。你说一个矩形是“从图片上剪下来的”。如果每个“cut”都是从磁盘中单独读取,则效率非常低,并且会显着增加执行时间。当您移动窗口时(看起来是 2 个像素),新窗口中的大部分数据都是相同的,因此请尽量避免重新读取该数据。
  2. 减小窗口大小或增加步长。这显然会影响您的结果,但根据您尝试进行 OCR 的字符大小,这可能是一个选项。
  3. 如果您正在应用卷积过滤器来执行 OCR,请考虑执行 fast convolution通过图像数据的 2D FFT。
  4. 多线程你的应用程序,如果它还没有的话。虽然你的问题不是 embarrassingly parallel ,它可以很容易地实现多线程。

关于java - OCR 中的滑动窗口需要很多时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13585104/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com