gpt4 book ai didi

python - 如何将 tesseract 添加到我的 Docker 容器中以便我可以使用 pytesseract

转载 作者:行者123 更新时间:2023-12-05 03:19:57 70 4
gpt4 key购买 nike

我正在做一个需要我在 docker 容器上运行 pytesseract 的项目,但我无法将 tesseract 安装到容器上,我也不知道pytesseract的文件路径应该是什么

我的 Dockerfile:

FROM python:3
ENV PYHTONUNBUFFERED=1
RUN apt-get update && apt-get install -y --no-install-recommends \
bzip2 \
g++ \
git \
graphviz \
libgl1-mesa-glx \
libhdf5-dev \
openmpi-bin \
wget \
python3-tk && \
rm -rf /var/lib/apt/lists/*




WORKDIR /usr/src/app
COPY requirements.txt ./
RUN pip install -r requirements.txt
ENV QT_X11_NO_MITSHM=1

我的 pytesseract 代码:

path_to_tesseract = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
pytesseract.tesseract_cmd = path_to_tesseract

img=cv2.imread(fpath)
img=cv2.resize(img,None,fx=2,fy=2, interpolation=cv2.INTER_CUBIC)
text=pytesseract.image_to_string(img)

最佳答案

我看到你也在使用 opencv。使用 pytesseract 需要以下依赖项:

FROM python:3.10-slim

ENV PYHTONUNBUFFERED=1
RUN apt-get update \
&& apt-get -y install tesseract-ocr \ # required for pytesseract
&& apt-get -y install ffmpeg libsm6 libxext6 # required for opencv

...
RUN pip install -r requirements.txt

但是当您使用 docker 时,我建议安装 opencv-python-headless 而不是 opencv ,后者主要用于 Docker 等 headless 环境。它将带有一个预编译的二进制轮,并减少 docker 镜像的大小。 Dockerfile 将缩减为:

FROM python:3.10-slim

ENV PYHTONUNBUFFERED=1
RUN apt-get update \
&& apt-get -y install tesseract-ocr

...
RUN pip install -r requirements.txt

关于python - 如何将 tesseract 添加到我的 Docker 容器中以便我可以使用 pytesseract,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73318168/

70 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com