gpt4 book ai didi

c++ - 如何检测扫描文档的方向?

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:48:05 25 4
gpt4 key购买 nike

我会检测并在必要时更正扫描文档图像的方向。我已经可以对文档进行校正,但是仍然可能会出现文档倒置并且需要旋转 180° 的情况。

使用 tesseract的布局分析功能应该可以使用以下代码确定文档的方向:

    tesseract::TessBaseAPI api; 
api.Init(argv[0], "eng");
api.SetImage(img);
api.SetPageSegMode(tesseract::PSM_AUTO_OSD);
tesseract::PageIterator* it = api.AnalyseLayout();

tesseract::Orientation orient;
tesseract::WritingDirection dir;
tesseract::TextlineOrder order;
float f;
it->Orientation(&orient, &dir, &order, &f);

if(orient == tesseract::Orientation::ORIENTATION_PAGE_UP)
std::cout << "Page Up\t";
else if(orient == tesseract::Orientation::ORIENTATION_PAGE_LEFT)
std::cout << "Page Left\t";
else if(orient == tesseract::Orientation::ORIENTATION_PAGE_DOWN)
std::cout << "Page Down\t";
else if(orient == tesseract::Orientation::ORIENTATION_PAGE_RIGHT)
std::cout << "Page Right\t";

但是该代码似乎无法正常工作,因为它总是在纵向格式的文档时返回 ORIENTATION_PAGE_UP,在横向格式时返回 ORIENTATION_PAGE_LEFT。 (可以使用 ORIENTATION_PAGE_DOWNORIENTATION_PAGE_RIGHT,但永远不会返回)。

A.) 上面的代码有什么问题吗?

B.) 我还能如何确定文档方向?

最佳答案

如果只运行检测评估检测率,然后翻转做同样的事情呢?更好的比率给出了正确的方向。

关于c++ - 如何检测扫描文档的方向?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8173566/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com