python - 如何从相机(或网络摄像头)在 python 中捕获视频(和音频)-6ren

python - 如何从相机(或网络摄像头)在 python 中捕获视频(和音频)

转载作者：IT老高更新时间：2023-10-28 21:01:46

我正在寻找一个解决方案，无论是在 linux 中还是在 windows 中，让我能够

同时从我的网络摄像头和麦克风录制视频(+音频)。
将其保存为 file.AVI(或 mpg 等)
在录制视频时在屏幕上显示视频

在我的情况下，压缩不是问题，我实际上更喜欢捕获 RAW 并稍后压缩它。

到目前为止，我已经在 VB 中使用了一个 ActiveX 组件来处理所有事情，我想继续使用 python(VB 解决方案不稳定、不可靠)。

到目前为止，我已经看到了仅捕获 VIDEO 或单个帧的代码...

我已经看过了

OpenCV - 在那里找不到音频捕获
PyGame - 无同步音频捕获 (AFAIK)
VideoCapture - 仅提供单帧。
SimpleCV - 无音频
VLC - 将 VideoLAN 程序绑定(bind)到 wxPthon - 希望它可以做到(仍在研究这个选项)
kivy - 刚听说过，没能在 Windows SO FAR 下运行。

问题 - 是否有适用于 python 的视频和音频捕获库？

或者 - 如果有的话，还有哪些其他选项？

最佳答案

回答:没有。python 中没有单一的库/解决方案可以同时进行视频/音频录制。您必须分别实现并以智能方式合并音频和视频信号以最终生成视频/音频文件。

我为您提出的问题找到了解决方案。我的代码解决了您的三个问题:

同时录制来自网络摄像头和麦克风的视频和音频。
它将最终的视频/音频文件保存为 .AVI
取消注释第 76、77 和 78 行将使视频在录制时显示在屏幕上。

我的解决方案使用 pyaudio 进行音频录制，使用 opencv 进行视频录制，使用 ffmpeg 混合这两个信号。为了能够同时记录两者，我使用多线程。一个线程录制视频，第二个线程录制音频。我已经将我的代码上传到了 github，并且在这里也包含了它的所有重要部分。

https://github.com/JRodrigoF/AVrecordeR

注意:opencv 无法控制网络摄像头进行录制的 fps。它只能在文件的编码中指定所需的最终 fps，但网络摄像头通常会根据规范和光照条件(我发现)表现不同。所以fps要控制在代码层面。

import cv2
import pyaudio
import wave
import threading
import time
import subprocess
import os

class VideoRecorder():  

    # Video class based on openCV 
    def __init__(self):

        self.open = True
        self.device_index = 0
        self.fps = 6               # fps should be the minimum constant rate at which the camera can
        self.fourcc = "MJPG"       # capture images (with no decrease in speed over time; testing is required)
        self.frameSize = (640,480) # video formats and sizes also depend and vary according to the camera used
        self.video_filename = "temp_video.avi"
        self.video_cap = cv2.VideoCapture(self.device_index)
        self.video_writer = cv2.VideoWriter_fourcc(*self.fourcc)
        self.video_out = cv2.VideoWriter(self.video_filename, self.video_writer, self.fps, self.frameSize)
        self.frame_counts = 1
        self.start_time = time.time()


    # Video starts being recorded 
    def record(self):

#       counter = 1
        timer_start = time.time()
        timer_current = 0


        while(self.open==True):
            ret, video_frame = self.video_cap.read()
            if (ret==True):

                    self.video_out.write(video_frame)
#                   print str(counter) + " " + str(self.frame_counts) + " frames written " + str(timer_current)
                    self.frame_counts += 1
#                   counter += 1
#                   timer_current = time.time() - timer_start
                    time.sleep(0.16)
#                   gray = cv2.cvtColor(video_frame, cv2.COLOR_BGR2GRAY)
#                   cv2.imshow('video_frame', gray)
#                   cv2.waitKey(1)
            else:
                break

                # 0.16 delay -> 6 fps
                # 


    # Finishes the video recording therefore the thread too
    def stop(self):

        if self.open==True:

            self.open=False
            self.video_out.release()
            self.video_cap.release()
            cv2.destroyAllWindows()

        else: 
            pass


    # Launches the video recording function using a thread          
    def start(self):
        video_thread = threading.Thread(target=self.record)
        video_thread.start()





class AudioRecorder():


    # Audio class based on pyAudio and Wave
    def __init__(self):

        self.open = True
        self.rate = 44100
        self.frames_per_buffer = 1024
        self.channels = 2
        self.format = pyaudio.paInt16
        self.audio_filename = "temp_audio.wav"
        self.audio = pyaudio.PyAudio()
        self.stream = self.audio.open(format=self.format,
                                      channels=self.channels,
                                      rate=self.rate,
                                      input=True,
                                      frames_per_buffer = self.frames_per_buffer)
        self.audio_frames = []


    # Audio starts being recorded
    def record(self):

        self.stream.start_stream()
        while(self.open == True):
            data = self.stream.read(self.frames_per_buffer) 
            self.audio_frames.append(data)
            if self.open==False:
                break


    # Finishes the audio recording therefore the thread too    
    def stop(self):

        if self.open==True:
            self.open = False
            self.stream.stop_stream()
            self.stream.close()
            self.audio.terminate()

            waveFile = wave.open(self.audio_filename, 'wb')
            waveFile.setnchannels(self.channels)
            waveFile.setsampwidth(self.audio.get_sample_size(self.format))
            waveFile.setframerate(self.rate)
            waveFile.writeframes(b''.join(self.audio_frames))
            waveFile.close()

        pass

    # Launches the audio recording function using a thread
    def start(self):
        audio_thread = threading.Thread(target=self.record)
        audio_thread.start()





def start_AVrecording(filename):

    global video_thread
    global audio_thread

    video_thread = VideoRecorder()
    audio_thread = AudioRecorder()

    audio_thread.start()
    video_thread.start()

    return filename




def start_video_recording(filename):

    global video_thread

    video_thread = VideoRecorder()
    video_thread.start()

    return filename


def start_audio_recording(filename):

    global audio_thread

    audio_thread = AudioRecorder()
    audio_thread.start()

    return filename




def stop_AVrecording(filename):

    audio_thread.stop() 
    frame_counts = video_thread.frame_counts
    elapsed_time = time.time() - video_thread.start_time
    recorded_fps = frame_counts / elapsed_time
    print "total frames " + str(frame_counts)
    print "elapsed time " + str(elapsed_time)
    print "recorded fps " + str(recorded_fps)
    video_thread.stop() 

    # Makes sure the threads have finished
    while threading.active_count() > 1:
        time.sleep(1)


#    Merging audio and video signal

    if abs(recorded_fps - 6) >= 0.01:    # If the fps rate was higher/lower than expected, re-encode it to the expected

        print "Re-encoding"
        cmd = "ffmpeg -r " + str(recorded_fps) + " -i temp_video.avi -pix_fmt yuv420p -r 6 temp_video2.avi"
        subprocess.call(cmd, shell=True)

        print "Muxing"
        cmd = "ffmpeg -ac 2 -channel_layout stereo -i temp_audio.wav -i temp_video2.avi -pix_fmt yuv420p " + filename + ".avi"
        subprocess.call(cmd, shell=True)

    else:

        print "Normal recording\nMuxing"
        cmd = "ffmpeg -ac 2 -channel_layout stereo -i temp_audio.wav -i temp_video.avi -pix_fmt yuv420p " + filename + ".avi"
        subprocess.call(cmd, shell=True)

        print ".."




# Required and wanted processing of final files
def file_manager(filename):

    local_path = os.getcwd()

    if os.path.exists(str(local_path) + "/temp_audio.wav"):
        os.remove(str(local_path) + "/temp_audio.wav")

    if os.path.exists(str(local_path) + "/temp_video.avi"):
        os.remove(str(local_path) + "/temp_video.avi")

    if os.path.exists(str(local_path) + "/temp_video2.avi"):
        os.remove(str(local_path) + "/temp_video2.avi")

    if os.path.exists(str(local_path) + "/" + filename + ".avi"):
        os.remove(str(local_path) + "/" + filename + ".avi")

关于python - 如何从相机(或网络摄像头)在 python 中捕获视频(和音频)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14140495/

文章推荐： Javah 工具错误 : Could not find class file for hellojni

文章推荐： java - 如果类没有成员变量，所有方法都应该是静态的吗

文章推荐： java - 删除字符串中重复字符的函数

文章推荐： java - 将 Java TreeMap 代码迁移到 Scala？

Android - 相机
有人能给我一些代码示例，了解如何从相机捕获“完整”图像，然后在“startActivityForResult”中将其转换为字节，以及显示在 imageView 中的位图。任何帮助将不胜感激。山姆最
java - 如何居中JavaFX场景图“相机”
我有一个带有两个圆的组，当我用平移过渡移动其中一个时，我应该看到静止的一个保持在中心（位于场景图的中间），而另一个移动。取而代之的是，“摄像机”跟随移动的圆圈，使其看起来好像都在分开。有没有一种方法
ios - Phonegap 相机
我希望停止 Phonegap 将图片保存到 iOS 上的相机胶卷。我发现了一种可能的解决方案，但我不太喜欢它。该解决方案需要通过删除这行代码来 fork phonegap API。 UIImageW
Java OpenGL 相机
我最近开始使用 JOGL，我知道如何在 Canvas 上创建和绘制对象，但我找不到有关如何设置和旋转相机的教程或说明。我只找到了源代码，但由于我对此很陌生，所以它没有太大帮助。有人知道一个好的教程或
Java Android 相机
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
android - 捕获时如何创建矩形区域(相机)
我想实现这样的目标: 因此，您捕获和处理的唯一内容是矩形中的区域。我需要这个，因为我想做一些 OCR 而我不想要整个屏幕。最佳答案也许可以帮助您这个来源，(在相机预览顶部绘制一个边界框以捕获部分图
Android 相机(照片未显示)
我正在开发一个 Android 应用程序，我希望我的应用程序能够拍照并显示它们。我的问题是它制作了图片，将它存储在 SD 卡上但没有在我的应用程序中显示它，ImageView 保持空白。这是我的代码:
java - 相机 NullPointerException
我正在研究 Android 相机教程，SDK 11。出于某种原因，我在 handleCameraPhoto() 中得到了一个空指针。我唯一看到的是“无法将结果 ResultInfo{who=null,
Android ImageView -相机
我一直在尝试实现此代码，我在其中从相机捕获图像并将其显示在我的图像查看器中，然后可以将其设置为墙纸。它在我的模拟器中运行良好，但在我的手机上，当我拍摄图像并单击“确定”时，它会强制关闭。有什么帮助吗？
Android 相机 - 如何更改预览中的像素？
我想将预览中的某些像素更改为比其余像素暗一点。假设我希望预览的上半部分比预览的下半部分暗一点。我试图像这样使用 setPreviewCallback: camera.setPreviewCallba
swift - 以编程方式设置照片库/相机
我想为我的应用程序启用相机/照片库设置。我可以显示警报以编程方式启用这些吗就像应用程序启动时一样。我已附上图片以显示我希望看到我的应用程序的类似设置对于我的应用程序，我没有看到此设置。我的问题是这
Android 相机、同步原始预览和原始拍照
所以我正在开发类似于相机应用程序的东西。它在原生 OpenGL 纹理上绘制实时相机预览。如果按下按钮，则会以原始形式捕获静态图像(可能比实时预览分辨率更高)。这是我的代码的大纲。为了清楚起见，我没有
用于图片和视频的 Android 相机
我想在我的 Android 应用程序中启动相机 Activity ，我知道该怎么做。我想问一下当相机 Activity 结束时，我如何检查它是否是用户拍摄的照片或视频？已更新我有一个对话框，其中询
android - 相机 - 开始录制视频后预览更改
我在横向模式下有自定义全屏摄像头。设备尺寸为 1024 x 600。支持的预览尺寸列表宽 x 高 176 x 144 320 x 240 352 x 288 528 x 432 640 x 480
iPhone 相机 - 从图库中选择或拍照
请看下图!! 所以在这张图片中...您可以看到底部的弹出窗口，当用户“点击”“相机”按钮时，它会为用户提供 3 个选项。那是什么观点？它是一个模态视图 Controller ，在选择一个选项时被关闭
相机 Intent 后Android崩溃
我发布了一个应用程序，其中一项基本功能是允许用户拍照，然后将该照片保存在其外部存储上的特定文件夹中。一切似乎都运行良好，但我现在收到两份报告，声称在拍照后单击“完成”退出相机(并返回到 Activi
camera - WebRTC - 实时更改设备/相机
我在尝试实时更换相机时遇到问题，它适用于本地视频，但远程人员看不到新相机，但仍然可以看到旧相机。我试图停止流并再次初始化，但仍然无法正常工作。这只是我的一些代码。我到处搜索，但找不到解决方案。有人可
flutter - 点按即可对焦 Flutter 相机
一个简单但非常复杂的问题:为 Flutter 相机添加点击对焦功能的最佳方法是什么？我在整个万维网上搜索了优雅的解决方案，但一无所获。你有想法吗？最佳答案我可能会迟到，但你可以试试 adv_c
OpenGL 3D 相机 gluLookAt
我正在尝试使用 gluLookAt 方法设置 3D 相机。所以我有一个 10x10x10 的立方体，现在我想在那个立方体内移动相机。我有这样的事情: gluLookAt( camera->x,came
SwiftUI 全屏 UIImagePickerController(相机)
我赠送一个 UIImagePickerController在我的应用程序中通过在 sheet 中呈现逻辑修饰符。简而言之，以下三种类型处理显示和关闭 UIImagePickerController 的

IT老高

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 如何从相机(或网络摄像头)在 python 中捕获视频(和音频)