python - 如何从视频流中提取文本？-6ren

python - 如何从视频流中提取文本？

转载作者：太空宇宙更新时间：2023-11-03 21:11:07

27

4

我正在尝试使用 opencv2 和 pytesseract 从来 self 的相机的视频流中提取一些文本。我裁剪图像以获得另一个小图像。我进行了不同的图像处理以使其正常工作。我反转了图像值，对其进行了模糊处理，将其二值化，但这些都没有使用 tesseract。我要提取的数据具有这些形式的“float/float”，这里是小图像的示例:

似乎字符没有分开，这是我可以从我的相机获得的最大分辨率。然后我尝试按颜色过滤，但没有结果，因为它是视频并且背景总是在移动。我将使用任何建议的 Python 模块。

最佳答案

并不像看起来那么简单。我为每个角色生成了 32x32 png 图像并为其添加了白噪声。视频的背景在移动。像 8 和 6 这样的字符差别不大。这是我目前的代码:

cap = cv2.VideoCapture("rtsp:...")
time.sleep(2)
templates = {}
w=[]
h=[]
for i in range(0,11):
    templates["template_"+str(i)]=cv2.imread(str(i)+'.bmp',0)
    tmp_w,tmp_h=templates["template_"+str(i)].shape[::-1]
    w.append(tmp_w)
    h.append(tmp_h)



threshold = 0.70



while(True):
    les_points=[[],[],[],[],[],[],[],[],[],[],[]]
    ret, frame = cap.read()
    if frame==None:
      break
    crop_image=frame[38:70,11:364]
    gray=cv2.cvtColor(crop_image,cv2.COLOR_BGR2GRAY)
    for i in range(0,11):
        res= cv2.matchTemplate(gray,templates["template_"+str(i)],cv2.TM_CCOEFF_NORMED)
        loc = np.where( res >= threshold)
        for pt in zip(*loc[::-1]):
            les_points[i].append(pt[0])
            cv2.rectangle(crop_image, pt, (pt[0] + w[i], pt[1] + h[i]), (0,i*10,255), 2)
    print les_points
    cv2.imshow('normal',crop_image)
    if cv2.waitKey(1)& 0xFF == ord('p'):
        threshold=threshold+0.01
        print threshold
    if cv2.waitKey(1)& 0xFF == ord('m'):
        threshold=threshold-0.01
        print threshold
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

我正在通过将图像拆分为与模板中的字符完全相同的大小来进行其他测试。但这并没有给出好的结果

关于python - 如何从视频流中提取文本？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40906970/

27

4

0

文章推荐： python - 在 python 3 中将字节转换为字符串

文章推荐： css - 使用 flexbox 将 flex 元素内的元素换行到下一行

文章推荐： javascript - jQuery 切换和动画行为问题

文章推荐： python - 使用 OpenCV 在二值图像中查找边缘(图形边缘)

Symfony2 视频流
我正在用 symfony2 编写应用程序，但我遇到了视频流问题。如果一个 Action 需要很长时间才能执行 - 例如 1 分钟，整个应用程序将被卡住(当在第二个选项卡中打开时)并且必须等待该执行结
Symfony2 视频流
我正在用 symfony2 编写应用程序，但我遇到了视频流问题。如果一个 Action 需要很长时间才能执行 - 例如 1 分钟，整个应用程序将被卡住(当在第二个选项卡中打开时)并且必须等待该执行结
C# 视频流
我正在尝试用视频流做一个应用程序，现在我只能从服务器向客户端发送一张图像。当我尝试在客户端发送不止一张图像时，我收到以下错误:“参数无效。”在 pictureBox1.Image = new Bitm
html5 视频流
我正在使用 mediaViews 和 html5 在我们的 cakephp 网站上流式传输视频截屏。我正在为播放器使用 videojs，但遇到了一些问题: 不会在 safari/ipad/iphone
electron - Electron中的RTSP(视频流)
我已经安装了fluent-ffmpeg和ffmpeg-static以将流转换为HTML可复制的视频。如何使用这些软件包在客户端中显示流？服务器端( main.js ): const { app, B
java - 放弃音频焦点并继续之前的音乐/视频流
我在我的应用程序中实现了 TTS(文本转语音)功能。一切都很顺利，但现在我遇到了一个无法找到解决方案的问题。基本上，我在激活 TTS 功能之前获得音频焦点。在实际的应用程序中，当我这样做时音乐就会停
java - gstreamer 视频流
我已经执行了开源社区链接发布的 AudioPlayer.java 示例 Audio Player Tutorial 我得到以下异常 Exception in thread "main" java.la
iOS - 视频流，防止视频被下载或保存到本地
有什么方法可以在iOS原生App中通过URL播放无法下载或保存到本地的视频流。我想让用户观看视频，但他不能在本地下载或保存视频(通过第 3 方下载器应用程序)。在 MPMoviePlayerCont
OpenCV MPEG 视频流
我正在开发用于网络吞吐量测试的点对点视频流。两个对等点之间的网络支持低比特率传输。我使用 OpenCV 为视频流制作了简单的 python 程序。该程序从网络摄像头抓取视频帧并将其编码为 JPEG
Android - m3u8 视频流
我正在我的应用程序中流式传输实时视频。我有一个 .m3u8 链接，它在 vlc 播放器中完美运行。但是当我在我的应用程序中播放这个流时，视频的可视化被破坏了(见截图)。有谁知道，这可能是什么原因造成的
Android 视频流 - 设备支持吗？
好的。因此，有数十亿种不同的 Android 设备。我有一个视频流服务，非常适用于 iOS。我的应用程序具有实时视频功能和保存的视频剪辑播放功能(也可以流式传输到设备)。我在不同的 Android 设
windows - 如何在自动化中验证音频/视频流
我有一个屏幕共享应用程序 (WebRTC)。一个用户想与另一个用户共享他的屏幕。就像一个应用程序在用户 1 机器上运行而另一个应用程序在用户 2 机器上运行。用户 1 想要共享他的屏幕，现在如何在用户
HTML5 视频流/寻
我正在尝试提供即时转码的视频。不幸的是，这意味着寻求不起作用。我假设这是因为浏览器不知道视频有多长，因此无法正确显示搜索栏。有谁知道是否可以对视频的时长进行硬编码？我想到的另一个选择可能是创建我自
gstreamer - 具有延迟的管道 Gstreamer 视频流
在将解复用的 h264 解码输出发送到 gstreamer 管道中的 autovideosink 之前，是否可以在两者之间提供一些延迟。如果是这样，任何人都可以发布示例管道来做到这一点。我使用的管道
来自不断增长的文件的 C# WCF 视频流？
一直在把我的头发拉出来，这本来应该是一项快速而简单的任务。我有一个自托管的 WCF 服务，我需要在其中实现实时视频转码，转码本身不是问题，使用 FFMpeg 到本地临时文件。我的代码的快速示例；
基于消息的 Websocket VP9 视频流
我想在 C# 应用程序和浏览器之间建立视频流。我使用 Websockets 进行通信。视频源是网络摄像头。我可以请求单个 PNG 帧，但速度太慢了。 websocket 服务器( Ratchet
flash - 哪种语言更适合 P2P 视频流？
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 9 年前。 Improve
rtp - 捕获 Lync 视频流
是否可以在 lync 2010 或 2013 中捕获 lync session 的视频流？我已经在我们的实验室中运行了测试版。 UCMA 为 AudioVideoFlow 提供了钩子(Hook)，但似
audio - 将音频添加到 ffmpeg 视频流
我有一个 ffmpeg 命令，它接收帧流并输出 ogg 视频。如何从另一个文件中添加音频？ ffmpeg -f rawvideo -pix_fmt bgr24 -s WIDTHxHEIGHT -r 3
c# - 具有空间数据的 Hololens 视频流
我正在使用全息镜头，并且我正在尝试保存具有可用世界/投影矩阵的视频流。我一直在尝试拍摄一系列照片并保存数据，但我找不到保存图像和矩阵的方法。保存到磁盘时，没有获取照片捕获帧(包含矩阵数据)的选项，保

首页

博学

6Ren·AI

商城

python - 如何从视频流中提取文本？