python-3.x - 如何使图像对比度更高，灰度然后使用 PIL 和 pytesseract 准确获取所有字符？-6ren

python-3.x - 如何使图像对比度更高，灰度然后使用 PIL 和 pytesseract 准确获取所有字符？

转载作者：行者123 更新时间：2023-12-03 17:28:33

25

4

请在此处下载附件并另存为 /tmp/target.jpg .

可以看到有0244R在jpg中，我使用以下python代码提取字符串:

from PIL import Image
import pytesseract
import cv2
filename = "/tmp/target.jpg"
image = cv2.imread(filename)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
ret, threshold = cv2.threshold(gray,55, 255, cv2.THRESH_BINARY)
print(pytesseract.image_to_string(threshold))

我得到的是

0244K

正确的字符串是 0244R ，如何使图像对比度更高，灰度然后使用 PIL 和 pytesseract 获得所有字符？
这是生成图像的网页:
http://www.crup.cn/ValidateCode/Index?t=0.14978241776661583

最佳答案

如果您申请 adaptive-thresholding和 bitwise-not对输入图像的操作，结果将是:

现在，如果您删除特殊字符，如(点、逗号等)

txt = pytesseract.image_to_string(bnt, config="--psm 6")
res = ''.join(i for i in txt if i.isalnum())
print(res)

结果将是:

O244R

代码:

import cv2
import pytesseract

img = cv2.imread("Aw6sN.jpg")
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thr = cv2.adaptiveThreshold(gry, 255, cv2.ADAPTIVE_THRESH_MEAN_C,
                            cv2.THRESH_BINARY_INV, 23, 100)
bnt = cv2.bitwise_not(thr)
txt = pytesseract.image_to_string(bnt, config="--psm 6")
res = ''.join(i for i in txt if i.isalnum())
print(res)

关于python-3.x - 如何使图像对比度更高，灰度然后使用 PIL 和 pytesseract 准确获取所有字符？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58314275/

25

4

0

文章推荐： machine-learning - 如何在 OCR 中区分斜线零和八 (0->8)

文章推荐： iphone - 替换数组中的字符串

文章推荐： xcode - cocoa 教程建议

添加边距时 CSS Body 更高
我有一个 DIV #page，如果我在顶部添加边距，突然出现一个滚动条，即使该元素不大于主体。我怎样才能去掉滚动条？ (参见 Fiddle) 我的 HTML I am a div siz
javascript - 如果不存在，则从数组中获取下一个最接近(更高)的值
function getClosestValue(standardArray, targetVal) { standardArray = standardArray.sort(function(a,
javascript - 当指定更高的高度不起作用时，如何使 iframe 更高？
我有 318x424 的书籍封面图片，我想做的是指定一张图片，并在其下方添加一个文本链接。初始 src 是 about:blank，这样如果响应式设计不显示框架，它就不会占用用户带宽。框架的 HTM
c++ - 根据关系的二维数组对数组进行排序(更高，更低，无关紧要)
我被这个问题困了两天了，还是没搞定。基本上，我有一个二维数组，其中包含某些数字(在给定范围内)之间的关系: 0 = 顺序无关紧要 1 = 第一个数字(左栏中的数字)应该是第一个 2 = 第二个数字(
android - 更高 API 上的 NetworkOnMainThreadException
只有当我在更高的 API 上进行调试时，我才会强制关闭脚本:16，但是当涉及到 API 时它工作正常:10。这可能是我的项目设置问题吗？这是对服务器的简单请求，以获取 fragment 中的类别列表
sql - 在插入/更新之前使用触发器重新排序相邻行(更高/更低)
给定下表books id | listorder ----+----------- 3 | 1 2 | 2 1 | 3 4 |
android - 防止 TextInputLayout 使 TextInputEditText 更高
我想要那个密码切换功能，好像TextInputLayout有这个功能，而不是 TextInputEditText .但是正如您在下面的代码中看到的，即使我将高度设置为 wrap_content和 ap
perl - 更高 ping 网络上的 Net::SSH2
似乎从读取给出空列表，它主要发生在延迟较高的网络上的主机上。是否有更强大的与远程主机交互的方式？ use Net::SSH2; # my $ssh = Net::SSH2->new(); # ..
android - 更高 API 级别的 SharedPreferences 不工作？
为了在 Play 商店中发布我的应用程序，我必须将 TargetSdkVersion 从 23 更改为 26。在我更改它之前，该应用程序运行良好!现在应用程序在启动时崩溃。我想通了，问题出在这两行:
html - Bootstrap grid .col 更高 - 相同的高度
我尝试了很多解决方案，但找不到一个。我有 3 个不同的列，其中包含不同类型的文本，我需要它们具有相同的高度。但它们是这样不同的:colums有人可以帮忙吗？代码: .col-sm-2{
css - 负 top 值使父 div 更高
我尝试将一个 div 相对于其具有负顶值的父级定位。这工作正常，现在的问题是这个 div，即使它有一个负的 top 值也会使父 div 更大。我该怎么做才能让父 div 不那么大？ Here's a
algorithm - 如何用常数值填充二维数组，效率比 n^2 更高？
这是一个一般性问题，可能适用于任何给定的语言，如 C、C++、Java 等。我认为无论以何种方式实现它，都不会比使用 2 个循环更高效，后者的效率为 n^2。 for(i=0;i O(1) )，要么
sql - 当不需要第二个表中的数据时，JOIN 的效率是否比 EXISTS IN 更高/更低？
我需要查找所有有订单的家庭。我根本不关心订单的数据，只关心它的存在。 (使用 SQL Server) 这样说是不是更有效率: SELECT HouseholdID, LastName, FirstNa
objective-c - 如何使 UINavigationController 中的 UIToolbar 更高？
我有一个 UINavigationController，在屏幕顶部有一个 UINavigationBar，在底部有一个 UIToolbar。我想让工具栏高一点。这是我的代码: CGRect toolb
html - 自定义字体在 Mac OS X 上看起来不同(更高)
我正在使用自定义字体。该字体在我的 Windows PC 上完美运行，但在我的 Mac (Yosemite OSX) 上运行不佳。正如您在图片中看到的，Mac 上的字体比 Windows 上的字体稍大
android - 通过 FaSTLane 部署 multiApkShadowedActiveApk 时出错，但我的版本号*更高*
我正在尝试使用 FaSTLane 将我的应用程序作为 alpha 版本部署到 Play 商店，但出现此错误: Google Api 错误:multiApkShadowedActiveApk:任何设备都
css - 设置 Angular Material Slider 的样式，使其更厚/更高
我在这里找不到神奇的调味料。看起来 API 不支持它，所以我想我正在寻找一些 CSS 来使 slider 更大。我得到的是左边的，但我想把它设计成右边的样子？任何 CSS 技巧或以前有人这样做过。
c - 为什么 'double' 在此 C 程序中存储/打印的精度值不比 'float' 更高？
如果我运行这段代码: float a=1.123456789; printf("The float value is %f\n",a); double b=1.123456789876543 prin
c++ - 使用与用于编译实际代码的不同(更高)版本的 gcc 构建 strip/binutils 是否会导致任何问题？
我正在尝试使用 strip binary 来剥离我的目标文件。我在 gcc-7 上构建了最新的 binutils，但我的代码库使用 gcc-4.9.2。Binutils 是为 64 位架构构建的，我的
iphone - iOS:是否可以使 UINavigationBar 更高，并使屏幕下方的其他 View 为 "push"？
有没有办法让 iPhone 应用的“内容”区域感知到更大的导航栏？类似这些问题: iOS: Adding a fixed image just below the navigation bar iO

首页

博学

6Ren·AI

商城

python-3.x - 如何使图像对比度更高，灰度然后使用 PIL 和 pytesseract 准确获取所有字符？