- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用如下示例代码开发 python tesseract 包:
import pytesseract
from PIL import Image
tessdata_dir_config = "--tessdata-dir \"/opt/homebrew/Cellar/tesseract-lang/4.1.0/share/tessdata/\""
image = Image.open("dataset/test.jpeg")
text = pytesseract.image_to_string(image, lang = "chi-sim", config = tessdata_dir_config)
print(text)
我收到以下错误消息:
pytesseract.pytesseract.TesseractError: (1, 'Error opening data file /opt/homebrew/Cellar/tesseract-lang/4.1.0/share/tessdata/chi-sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language 'chi-sim' Tesseract couldn't load any languages! Could not initialize tesseract.')
根据我的理解,错误发生在读取文件 chi-sim.traineddata
(代表简体中文)时,我将在下面解释我为解决此问题所做的尝试。
tesseract
和 tesseract-lang
。我很确定上面指定的路径正是源文件所在的位置,因为当我调用print(pytesseract.get_languages(config = ""))
我打印了一长串语言,包括 chi-sim。
text = pytesseract.image_to_string(image)
TESSDATA_PREFIX
,包括:在原始代码中使用 config
参数。
在 PyCharm 中添加全局环境变量。
在代码中添加以下行
os.environ["TESSDATA_PREFIX"] = "tesseract/4.1.1/share/tessdata/"
bash_profile
export TESSDATA_PREFIX=/opt/homebrew/Cellar/tesseract-lang/4.1.0/share/tessdata/
但不幸的是,这些都不起作用。
chi-sim.traineddata
不知何故被破坏了,所以我直接从 GitHub ( https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata ) 下载训练数据文件,点击“下载”按钮右边,将下载的文件放在tesseract-lang和原tesseract目录下(eng.traineddata
所在)。是的,我都试过了,但都没有用。关于这个问题,有什么可能的解决方案吗?
最佳答案
如果我将 lang="chi_sim"
与 _
而不是 -
一起使用,代码在 Linux 上对我有用,因为从服务器下载的文件有名称chi_sim.traineddata
也使用 _
而不是 -
。
如果我将文件重命名为 chi-sim.traineddata
然后我可以使用 lang="chi-sim"
(使用 -
而不是_
)
关于python - Pytesseract 加载语言失败 'chi-sim',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68420764/
我刚开始在较小的项目中使用 chi,我很好奇这里是如何处理静态文件服务的。完成它的最短方法是什么? 这是我尝试的文件服务 fs := http.FileServer(http.Dir("static"
我正在使用如下示例代码开发 python tesseract 包: import pytesseract from PIL import Image tessdata_dir_config = "--
转到此处,使用 Chi 渲染器获取基本的 REST 服务。我有以下结构和功能: type Order struct { OrderId uuid.UUID `json
到这里。试图让 chi 渲染器返回 Order 的列表struct 实例并得到一个我不明白的编译器错误: package myapp import ( "net/http" "gith
我正在尝试使用列联表在 Python 中计算卡方值。这是一个例子。 +--------+------+------+ | | Cat1 | Cat2 | +--------+------
在 Golang 应用程序中,我使用带有 mySQL 后端的 gorilla/session 在 session 中存储数据,但我想将数据存储在 chi 路由器上下文中。如何将身份验证 token 字
这个问题已经有答案了: json.Marshal(struct) returns "{}" (3 个回答) 已关闭去年。 考虑 main/entry 函数中的以下代码 r := chi.New
我正在尝试针对 golang chi 服务器 ( https://github.com/go-chi/chi ) 获取跨源请求。浏览器发出的预检请求未获得预期的 header (下面的屏幕截图)。 这
我正在尝试使用 sklearn.svm.SVC 来完成一些文本分类任务。我知道在使用 SVM 建模之前执行特征选择是一项有点值得怀疑的尝试,因为当使用全套特征时性能通常会达到峰值。从学术角度来看,了解
我有一个包含 42 个特征和 1 个标签的数据集。我想在执行决策树之前应用 Spark ML 库的选择方法卡方选择器来检测异常,但在应用卡方选择器期间遇到此错误: org.apache.spark.S
我正在开发具有以下项目结构的 Go Web 应用程序: 用户界面 模板 登录.tmpl 静态的 CSS 主题.css main.go 我的 main.go 代码(为简洁起见只显示相关部分)。我正在使用
如何使用 go-chi 框架的 gzip 中间件启用 gzip 压缩? 尝试使用此处显示的示例: https://github.com/go-chi/chi/issues/204 但是当我检查 cur
运行 dep ensure 后,go-chi 缺少中间件子包。 project-backend | main.go:8:2: cannot find package "github.com/
我正在尝试编写一个 Python 脚本,仅在以 *CHI: 开头的行上标记所有英文单词,并在单词末尾添加“@s:eng”,但代码似乎不起作用。目前,代码如下所示: import re with ope
我正在使用 chi 路由器编写一个网络应用程序,并为数据库连接字符串和 gorilla session mysqlstore 提供全局变量。我想将这些传递给 chi mount 函数而不是使用全局变量
我试图在样本数据上构建逻辑回归模型。 我们可以得到的模型输出是用于构建模型的特征的权重。 我找不到用于估计标准误差、Wald-Chi Square 统计量、p 值等的 Spark API。 我在下面粘
-- routes.go -- package main import ( "hotelsystem/pkg/config" "hotelsystem/pkg/handlers"
-- routes.go -- package main import ( "hotelsystem/pkg/config" "hotelsystem/pkg/handlers"
我是 golang 新手,正在使用 chi 在 golang 中开发一个 Restful 服务。我正在尝试创建一条路线,如下所示: func NewRouter(dm *storage.Dat
我正在为我的应用程序使用 go-chi 路由器,但是如果我将我的路由设置为“/something”,我将无法同时为“/something”和“/something/”提供服务 r := chi.New
我是一名优秀的程序员,十分优秀!