gpt4 book ai didi

php - ABBYY OCR SDK : I am trying a sample script for recognizing business cards but not getting any output

转载 作者:行者123 更新时间:2023-12-04 05:51:42 25 4
gpt4 key购买 nike

我正在尝试使用来自 ABBYY.com 的 PHP 中的 OCR SDK 来识别名片。我有以下代码只是为了检查它是如何工作的。当我执行代码时,我得到一个空白输出。我可能在代码上哪里出错了?

$applicationId = "MyBusinessCardReader";
$password = "密码";
$filename = "businesscard.jpg";
$localDir = 目录名(__FILE__);
$url = "http://cloud.ocrsdk.com/processBusinessCard";

$c = curl_init();
curl_setopt($c, CURLOPT_URL, $url);
curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($c, CURLOPT_USERPWD, "$applicationId:$password");
curl_setopt($c, CURLOPT_POST, 1);

$post_array = 数组(
"my_file"=> "@$localDir$filename"
);

curl_setopt($c, CURLOPT_POSTFIELDS, $post_array);
$response = curl_exec($c);
curl_close($c);

echo "

";
echo $response;
echo “
”;

可以在 http://test.goje87.com/vangal/businesscard.jpg 看到示例名片图像

最佳答案

我对 Abbyy SDK 了解不多。但是在对图像尝试任何 OCR 引擎之前,您应该始终确保...

  • ...用不同的颜色裁剪所有边框,
  • ...缩放图像,使文本的(虚拟)大小至少为每 300 DPI 10 pt。

  • 我针对您的原始样本尝试了 Tesseract v3.01,但没有找到任何内容。

    然后我应用了一个 ImageMagick 命令来裁剪边框并将图像缩放到 200%,如下所示:
    convert                 \
    businesscard.jpg \
    -crop 440x200+30+120 \
    -scale 180% \
    cropped+scaled-businesscard.jpg

    得到这张照片:

    Cropped businesscard

    这已经让 Tesseract 的命令行识别大部分文本(它在 @. 上失败):
    tesseract b.jpg bcard && cat bcard.txt

    Tesseract Open Source OCR Engine v3.01 with Leptonica

    Fe/<70"
    MIKE FARAG
    PH 913 284 6455
    EM milzeocreatefervoncom
    Tw 0mil<efarag01
    createfervoncom

    如果我愿意的话,一个人最有可能得到 Tesseract 的识别率接近 100%。
  • ... 为 OCR 目的提高图片质量:增加对比度并转换为纯灰度(“二值化”);
  • ...'train' Tesseract 用于本文档中使用的特定字体。

  • 我假设你可以通过类似的措施让艾比的生活更轻松......

    关于php - ABBYY OCR SDK : I am trying a sample script for recognizing business cards but not getting any output,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9992363/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com