python - Tensorflow 实时对象检测 - 需要优化建议-6ren

python - Tensorflow 实时对象检测 - 需要优化建议

转载作者：太空宇宙更新时间：2023-11-03 21:41:31

25

4

我正在开发一款软件，可以在家庭监控系统的多个摄像头设备上进行实时人员检测。

我目前正在运行 Opencv 以从 IP 摄像机和 tensorflow 中抓取帧以分析和查找它们上的对象(代码与可以在 Tf 对象检测 API 中找到的代码非常相似)。我还在这个链接上尝试了来自 tensorflow object detection api 的不同卡住推理图:

https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md

我有一台配备 CPU Intel Core i7-6700 CPU @ 3.40GHz × 8 的台式电脑，我的 GPU 是 NVidia Geforce gtx960ti。

该软件按预期运行，但比预期慢 (3-5 FPS)，并且对于仅在 1 个相机设备上运行的单个 python 脚本，CPU 使用率相当高 (80-90%)。

我做错了什么吗？优化性能并实现更好的 FPS 和更低的 CPU 使用率以同时分析更多视频源的最佳方法是什么？到目前为止，我已经研究了多线程，但我不知道如何在我的代码中实现它。

代码片段:

使用 detection_graph.as_default(): 以 tf.Session(graph=detection_graph) 作为 sess: 而真实的: 帧 = cap.read() frame_expanded = np.expand_dims(frame, 轴 = 0) image_tensor = detection_graph.get_tensor_by_name("image_tensor:0") boxes = detection_graph.get_tensor_by_name("detection_boxes:0") 分数 = detection_graph.get_tensor_by_name("detection_scores:0") classes = detection_graph.get_tensor_by_name("detection_classes:0") num_detections=detection_graph.get_tensor_by_name("num_detections:0") (boxes, scores, classes, num_detections) = sess.run( [框，分数，类，num_detections]， feed_dict = {image_tensor: frame_expanded}) vis_util.visualize_boxes_and_labels_on_image_array(框架，...) cv2.imshow("视频", 帧) 如果 cv2.waitKey(25) & 0xFF == ord("q"): cv2.destroyAllWindows() cap.stop() 休息

最佳答案

我为我的项目尝试的一些事情可能会有所帮助，

使用 nvidia-smi -l 5，并监控 GPU 使用情况和内存使用情况。

在 OpenCV 和 TF 之间创建一个小的 buff，这样它就不会竞争相同的 GPU 资源，

BATCH_SIZE = 200
frameCount = 1
images = []

while (cap.isOpened() and frameCount <= 10000):

    ret, image_np = cap.read()

    if ret == True:
            frameCount = frameCount + 1

            images.append(image_np)

            if frameCount % BATCH_SIZE == 0:

                start = timer()
                output_dict_array = run_inference_for_images(images,detection_graph)
                end = timer()
                avg = (end - start) / len(images)

                print("TF inference took: "+str(end - start) +" for ["+str(len(images))+"] images, average["+str(avg)+"]")

                print("output array has:" + str(len(output_dict_array)))

                for idx in range(len(output_dict_array)):
                    output_dict = output_dict_array[idx]
                    image_np_org = images[idx]
                    vis_util.visualize_boxes_and_labels_on_image_array(
                        image_np_org,
                        output_dict['detection_boxes'],
                        output_dict['detection_classes'],
                        output_dict['detection_scores'],
                        category_index,
                        instance_masks=output_dict.get('detection_masks'),
                        use_normalized_coordinates=True,
                        line_thickness=6)

                    out.write(image_np_org)
                    ##cv2.imshow('object image', image_np_org)

                del output_dict_array[:]
                del images[:]



    else:
        break

使用移动网络模型。
将捕获的大小调整为 1280 * 720，将捕获保存为文件，然后对该文件运行推理。

我做了以上所有，并在 GTX1060(6GB) 笔记本电脑上存档了 12 ~ 16 FPS。

    2018-06-04 13:27:03.381783: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1435] Adding visible gpu devices: 0
    2018-06-04 13:27:03.381854: I tensorflow/core/common_runtime/gpu/gpu_device.cc:923] Device interconnect StreamExecutor with strength 1 edge matrix:
    2018-06-04 13:27:03.381895: I tensorflow/core/common_runtime/gpu/gpu_device.cc:929]      0 
    2018-06-04 13:27:03.381933: I tensorflow/core/common_runtime/gpu/gpu_device.cc:942] 0:   N 
    2018-06-04 13:27:03.382069: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1053] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 5211 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1060 with Max-Q Design, pci bus id: 0000:01:00.0, compute capability: 6.1)
    ===TF inference took: 8.62651109695 for [100] images, average[0.0862651109695]===

关于python - Tensorflow 实时对象检测 - 需要优化建议，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50630103/

25

4

0

文章推荐： java - 我需要帮助在 selenium Java 中查找 Web 元素

文章推荐： python - 矢量化/广播与使用solve_ivp求解ODE之间的冲突

文章推荐： css - 嵌套的 CSS Div 和 Span 样式不起作用

文章推荐：不带索引列的 Python 数据透视 DataFrame

windows-8 - 从 Metro 应用程序检测桌面可用性(检测 ARM、检测 Windows RT 系统)
这是一个与 Get OS-Version in WinRT Metro App C# 相关的问题但不是它的重复项。是否有任何选项可以从 Metro 应用程序检测系统上是否有可用的桌面功能？据我所知，
Android闹钟广播/检测
我想在闹钟响起时做点什么。例如， toast 或设置新闹钟。我正在寻找可以检测闹钟何时响起的东西。首先，我在寻找广播 Action ，但找不到。也许是我的错？当闹钟响起时，还有其他方法可以做些什么吗
security - 检测、更改或删除现有的变异观察者
如果某个 JS 添加了一个突变观察者，其他 JS 是否有可能检测、删除、替换或更改该观察者？我担心的是，如果某些 JS 旨在破坏某些 DOM 元素而不被发现，那么 JS 可能想要摆脱任何观察该 DOM
CUDA的 torch 检测
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。想要改善这个问题吗？更新问题，以便将其作为on-topi
Android:检测 USB
有没有办法在您的 Activity/应用程序中(以编程方式)知道用户已通过 USB 将您的手机连接到 PC？最佳答案有人建议使用 UMS_CONNECTED自最新版本的 Android 起已弃用
javascript - 检测/测量滚动速度
我正在想办法测量速度滚动事件，这将产生某种代表速度的数字(相对于所花费的时间，从滚动点 A 到点 B 的距离)。我欢迎任何以伪代码形式提出的建议...... 我试图在网上找到有关此问题的信息，但找不
Javascript 检测 Skype？
某些 JavaScript 是否可以检测 Skype 是否安装？我问的原因是我想基于此更改链接的 href:如果未安装 Skype，则显示一个弹出窗口，解释 Skype 是什么以及如何安装它，如果已
macos - 检测 CGAsociateMouseAndMouseCursorPosition
我们正在为 OS X 制作一个使用 Quartz Events 移动光标的用户空间设备驱动程序，当游戏(尤其是在窗口模式下运行的游戏)无法正确捕获鼠标指针时，我们遇到了问题(= 将其包含/保留在其窗口
AngularJS - 检测、停止和取消路线更改
我可以在 Controller 中看到事件 $routeChangeStart，但我不知道如何告诉 Angular 留下来。我需要弹出类似“您要保存、删除还是取消吗？”的信息。如果用户选择取消，则停留
java - 圆形阵列环路，检测
我正在解决一个问题，并且已经花了一些时间。问题陈述:给你一个正整数和负整数的数组。如果索引处的数字 n 为正，则向前移动 n 步。相反，如果为负数(-n)，则向后移动 n 步。假设数组的第一个元素向前
javascript - 检测[i]值
我试图建立一个条件，其中 [i] 是 data.length 的值，问题是当有超过 1 个值时一切正常，但当只有 1 个值时，脚本不起作用。 out.href = data[i].hr
java - 物体识别/检测？
这是我的问题，我需要检测图像中的 bolt 和四分之一，我一直在搜索并找到 OpenCV，但据我所知它还没有在 Java 中。你们打算如何解决这个问题？最佳答案实际上有一个 OpenCV 的 Ja
Java - 检测 ping
是否可以检测 ping？ IE。设备 1 ping 设备 2，我想要可以在设备 2 上运行的代码，该代码可以在设备 1 ping 设备时进行检测。最佳答案 ping 实用程序使用的字面消息(“ICM
用于分布式累积批处理作业的 Prometheus 检测
我每天多次运行构建脚本。我的感觉是我和我的同事花费了大量时间等待这个脚本执行。现在想知道:我们每天花多少时间等待脚本执行？ .我可以对总体平均值感到满意，即使我真的很想拥有每天的数据(例如“上周一我们
iphone - 检测/修复内存泄漏
我已经完成了对项目的编码，但是当我在客户端中提交了源代码时，就对它进行了测试，然后检测到内存泄漏。我已经在Instruments using Leaks中进行了测试。我遇到的问题是AVPlayer和
检测 Callable 是否是静态的
我想我可以用 std.traits.functionAttributes 来做到这一点，但它不支持 static。对于任何类型的可调用对象(包含 opCall 的结构)，我如何判断该可调用对象是否使用
r - 检测/确保在多核中使用多核
我正在使用多核 R 包中的并行和收集函数来并行化简单的矩阵乘法代码。答案是正确的，但并行版本似乎与串行版本花费的时间相同。我怀疑它仅在一个内核上运行(而不是在我的机器上可用的 8 个内核!)。有没有
Python 检测 EOF
我正在尝试在读取 csv 文件时编写一个这样的 if 语句: if row = [] or EOF: do stuff 我在网上搜索过，但找不到任何方法可以做到这一点。帮忙？最佳答案 wit
javascript - 检测/捕获字体大小变化的最佳方法是什么？
我想捕捉一个 onFontSizeChange 事件然后做一些事情(比如重新渲染，因为浏览器已经改变了我的字体大小)。不幸的是，不存在这样的事件，所以我必须找到一种方法来做到这一点。我见过有人在不可
c# - 检测/监听服务启动和停止状态变化
我有一个使用 Windows 服务的 C# 应用程序，该服务并非始终打开，我希望能够在该服务启动和关闭时发送电子邮件通知。我已经编写了电子邮件脚本，但我似乎无法弄清楚如何检测服务状态更改。我一直在阅

首页

博学

6Ren·AI

商城

python - Tensorflow 实时对象检测 - 需要优化建议