gpt4 book ai didi

r - R中的正方体无法识别 "&"

转载 作者:行者123 更新时间:2023-12-04 15:50:26 26 4
gpt4 key购买 nike

我是 R 编程的初学者,应该编写代码来从图像中读取文本!
我正在使用 Tesseract 和 Magick 包来做同样的事情,并面临代码将“&”转换为“8”的问题:
我附上了我用作输入的图像。 Image used for processing

下面是我正在运行的代码

test2 <- image_read("C:/Users/admin/Desktop/testimage.jpg") %>%
image_resize("2000") %>%
image_convert(colorspace = 'gray') %>%
image_trim() %>%
image_ocr()
cat(test2)
write.table(test2, "C:/Users/admin/Desktop/output2.txt", sep="\t")

下面是我得到的输出
No relation between boycotting
panchayat polls 8: Article 35A:
Subramanian Swamy

我已经提到了 following source 以获得一些理解,但没有找到任何适合这个特定问题的解决方案。

我也浏览过这个网站,但在阅读特殊字符方面没有找到太多帮助。

如果有人可以帮助我,那将非常有帮助。

最佳答案

您可以使用带有 TIF 而不是 JPG 的 Imagemagick 来做同样的事情吗?
我使用了以下查询并且它有效。

test20 <- image_read("E:/xx/image.tif") %>%
image_resize("4000") %>%
image_convert(colorspace = 'gray') %>%
image_trim() %>%
image_ocr()
cat(test20)
write.table(test2, "E:/xx/output.txt", sep="\t")

关于r - R中的正方体无法识别 "&",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52410341/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com