gpt4 book ai didi

ocr - 我可以使用 OCR 检测字体样式(粗体、斜体)吗?

转载 作者:行者123 更新时间:2023-12-04 02:03:39 32 4
gpt4 key购买 nike

关闭。这个问题需要更多focused .它目前不接受答案。












想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post .

5年前关闭。




Improve this question




我对使用 OCR 从简单文本中提取粗体和斜体词很感兴趣。例如,如果我输入一个带有文本的清晰图像,如下所示:

“敏捷的 棕色 狐狸 跳过了 越过懒狗。”

我想得到这样的输出:bold("brown", "jumps"), italic("lazy")

我已经研究过用 OCRopus 或 Tesseract 来做这件事,但是文档很差,我不知道这是否可行,或者如果可行的话如何做。

最佳答案

Tesseract 3.0.1 中有这样的功能,来自trunk。 API 中添加了一个新类 - ResultIterator ,它具有您感兴趣的以下功能:

 WordFontAttributes(bool* is_bold,
bool* is_italic,
bool* is_underlined,
bool* is_monospace,
bool* is_serif,
bool* is_smallcaps,
int* pointsize,
int* font_id).

其实你可以自己看 here.

关于ocr - 我可以使用 OCR 检测字体样式(粗体、斜体)吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5163329/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com