python - 使用基于状态的标签注释视频帧-6ren

python - 使用基于状态的标签注释视频帧

转载作者：太空宇宙更新时间：2023-11-04 10:24:43

25

4

我有一堆视频和深度图显示来自 Microsoft Kinect 的人体姿势。

我可以得到视频中人的骨架，但我想做的是从这个骨架数据中识别出特定的姿势。

为此，我需要用 0 或 1 对视频中的每一帧进行注释，对应于“不良姿势”和“良好姿势”，即该帧具有二进制状态变量。

我希望能够在 matlab 中播放 avi 文件，然后按空格键在这两种状态之间切换，同时将状态变量添加到数组中，给出视频中每一帧的状态。

matlab 中有没有工具可以做到这一点？否则matlab不限制，python、C++或任何其他语言都可以。

我一直在谷歌搜索，我发现的大部分内容都是用多边形注释单个帧。我想以视频常规帧速率的一半执行此操作。

编辑:我使用了 miindlek 提供的解决方案，并决定在有人遇到这个问题时分享一些东西。我需要在视频中看到我为每一帧分配了什么注释，所以我在显示视频时在视频的左上角画了一个小圆圈。希望这对以后的其他人有用。我还捕获了用 waitKey 按下的键，然后根据输出执行某些操作。这允许在注释期间按下多个键。

import numpy as np
import cv2
import os
os.chdir('PathToVideo')

# Blue cicle means that the annotation haven't started
# Green circle is a good pose
# Red is a bad pose
# White circle means we are done, press d for that

# Instructions on how to use!
# Press space to swap between states, you have to press space when the person
# starts doing poses. 
# Press d when the person finishes.
# press q to quit early, then the annotations are not saved, you should only 
# use this if you made a mistake and need to start over.

cap = cv2.VideoCapture('Video.avi')

# You can INCREASE the value of speed to make the video SLOWER
speed = 33

# Start with the beginning state as 10 to indicate that the procedure has not started
current_state = 10
saveAnnotations = True
annotation_list = []
# We can check wether the video capture has been opened
cap.isOpened()
colCirc = (255,0,0)
# Iterate while the capture is open, i.e. while we still get new frames.
while(cap.isOpened()):
    # Read one frame.
    ret, frame = cap.read()
    # Break the loop if we don't get a new frame.
    if not ret:
        break
    # Add the colored circle on the image to know the state
    cv2.circle(frame,(50,50), 50, colCirc, -1)
    # Show one frame.
    cv2.imshow('frame', frame)
    # Wait for a keypress and act on it
    k = cv2.waitKey(speed)
    if k == ord(' '):
        if current_state==0:
            current_state = 1
            colCirc = (0,0,255)
        else:
            current_state = 0
            colCirc = (0,255,0)
        if current_state == 10:
            current_state = 0
            colCirc = (0,255,0)
    if k == ord('d'):
        current_state = 11
        colCirc = (255,255,255)

    # Press q to quit
    if k == ord('q'):
        print "You quit! Restart the annotations by running this script again!"
        saveAnnotations = False
        break

    annotation_list.append(current_state)

# Release the capture and close window
cap.release()
cv2.destroyAllWindows()

# Only save if you did not quit
if saveAnnotations:
    f = open('poseAnnot.txt', 'w')
    for item in annotation_list:
        print>>f, item
    f.close()

最佳答案

解决您的任务的一种方法是将 opencv 库与 python 一起使用，如本 tutorial 中所述.

import numpy as np
import cv2

cap = cv2.VideoCapture('video.avi')

current_state = False
annotation_list = []

while(True):
    # Read one frame.
    ret, frame = cap.read()
    if not ret:
        break

    # Show one frame.
    cv2.imshow('frame', frame)

    # Check, if the space bar is pressed to switch the mode.
    if cv2.waitKey(1) & 0xFF == ord(' '):
        current_state = not current_state

    annotation_list.append(current_state)

# Convert the list of boolean values to a list of int values.    
annotation_list = map(int, annotation_list)
print annotation_list

cap.release()
cv2.destroyAllWindows()

变量annotation_list 包含每一帧的所有注释。要在两种模式之间切换，您必须按空格键。

关于python - 使用基于状态的标签注释视频帧，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30028841/

25

4

0

文章推荐： java - Spring:实际请求参数不满足参数条件 "loanTitle"

文章推荐： html - 第二个兄弟 div 元素不继承高度

文章推荐： Linux:使用 egrep 计算出现次数

java - Eclipse 视频 Intent 视频
我对此很陌生，我在这里的论坛上检查过答案，但我没有找到任何真正可以帮助我的答案。我正在尝试播放 res/raw 文件夹中的视频。到目前为止我已经设置了这段代码: MediaPlayer mp; @Ov
javascript - 视频，表单，然后是 html 视频
我可以播放一个视频剪辑，检测视频的结尾，然后创建一个表单，然后播放另一个视频剪辑。我的问题是，表单 react 不正确，我创建了带有提交按钮和两个单选按钮可供选择的表单。我希望让用户进行选择，验证响应
python - web2py 网站不加载所有图像/视频(尤其是较大的图像/视频)
首先，我必须说我在web2py讨论组中看到过类似的内容，但我不太理解。我使用 web2py 设置了一个数据库驱动的网站，其中的条目只是 HTML 文本。其中大多数将包含 img和/或video指向相
android - 视频 View 不播放 youtube 视频
我正在尝试在视频 View 中播放 YouTube 视频。我将 xml 布局如下: 代码是这样的: setContentView(R.layout.webview); VideoV
android - 如何在 Android 视频 View 中播放 Youtube 视频？
我正在开发一个需要嵌入其中的 youtube 视频播放器的 android 应用程序。我成功地从 API 获得了 RTSP 视频 URL，但是当我试图在我的 android 视频 View 中加载这个
javascript - 使用 YouTube 视频 ID 访问 YouTube 视频 URL
我目前正在从事一个使用 YouTube API 的网络项目。我完全不熟悉 API。所以每一行代码都需要付出很多努力。使用以下代码，我可以成功检索播放列表中的项目: https://www.goog
php - 使用 PHP、视频 ID 和 API key 删除 youtube 视频
是否可以仅使用视频 ID 和 key 使用 API V3 删除 youtube 视频？我不断收到有关“必需参数:部分”丢失的错误消息。我用服务器和浏览器 api 键试了一下这是我的代码: // $yo
python - 使用 RegEx 从字符串中获取 YouTube 视频 url 或 YouTube 视频 ID
所以我一直坚持这个大约一个小时左右，我就是无法让它工作。到目前为止，我一直在尝试从字符串中提取整个链接，但现在我觉得只获取视频 ID 可能更容易。 RegEx 需要从以下链接样式中获取 ID/URL，
javascript - 在 Angular js 中嵌入来自 json 响应的 Youtube 视频 url 和 Vimeo 视频 url 时的问题
var app = angular.module('speakout', []).config( function($sceDelegateProvider) {
Android如何从xml中识别音频/视频？
我正在努力从 RSS 提要中阅读音频、视频新闻。我如何确定该 rss 是用于新闻阅读器还是用于音频或视频？这是视频源:http://feeds.cbsnews.com/CBSNewsVideo 这是
如何用python反转图片,视频
利用python反转图片/视频准备：一张图片/一段视频 python库：pillow,moviepy 安装库 ?
HTML5 视频 - 双击全屏
我希望在用户双击视频区域时让我的视频全屏显示，而不仅仅是在他们单击控件中的小图标时。有没有办法添加事件或其他东西来控制用户点击视频时发生的情况？谢谢! 最佳答案按照 Musa 的建议，附
PHP转换图像+音频=视频
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 7年前关闭。 Improve this questi
本地服务器上的 HTML5 视频
我有一个公司培训视频加载到本地服务器上。我正在使用 HTML5 的视频播放来观看这些视频。该服务器无法访问网络，但我已加载 apache 并且端口 8080 对同一网络上的所有机器开放。这些文件位于
ffmpeg - 使用ffmpeg混合不同长度的音频/视频
我想混合来自 video.mp4 的视频(时长 1 分钟)和来自 audio.mp3 的音频(10 分钟持续时间)到一个持续时间为 1 分钟的输出文件中。来自 audio.mp3 的音频应该是从 4
c# - 如何通过互联网向多个客户端发送音频/视频？
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 8年前关闭。 Improve this questi
javascript - 视频/音频通信
我正在尝试使用 peer/getUserMedia 创建一个视频 session 网络应用程序。目前，当我将唯一 ID 发送到视频 session 时，我能够听到/看到任何加入我的 session
video - 视频/列表统计信息多久更新一次？
考虑到一段时间内的观看次数，我正在评估一种针对半自动脚本的不同方法，该脚本将对视频元数据执行操作。简而言之，只要视频达到指标中的某个阈值，就说观看次数，它将触发某些操作。现在要执行此操作，我将不得
html - 适用于YouTube的HTML5 <视频>
我正在通过iBooks创建专门为iPad创建动态ePub电子书的网站。它需要支持youtube视频播放，所以当我知道视频的直接路径时，我正在使用html5 标记。有没有一种使用html5 标签嵌入
android - 如何在Webview中显示Youtube网站/视频？
我对Android不熟悉，我想浏览youtube.com并在Webview内从网站显示视频。当前，当我尝试执行此操作时，将出现设备的浏览器，并让我使用设备浏览器浏览该站点。如果Webview不具备这种

首页

博学

6Ren·AI

商城

python - 使用基于状态的标签注释视频帧