gpt4 book ai didi

c++ - Dlib。如何解决实时的优化约束?地标融合的想法?

转载 作者:行者123 更新时间:2023-11-30 03:40:38 25 4
gpt4 key购买 nike

我想使用 dlib 库来实时检测面部特征点。该算法基于论文:Vahid Kazemi 和 Josephine Sullivan 的 One Millisecond Face Alignment with an Ensemble of Regression Trees

我使用现有的库:dlib,它很慢。我在 http://dlib.net/faq.html 上阅读了如何快速完成此操作,但这在我的电脑上是不可能的,因为在 SSE4 或 AVX 之前我没有优化选项。最后,我使用 SSE2。所以我有以下问题:

-可以在移动/网络应用程序库 dlib 中使用,以便它实时工作吗?我不熟悉优化设置等,这就是为什么有多少限制很有趣。

-可以在我的电脑上使用而不优化 SSE4 以便它实时工作吗?

-此文件 shape_predictor_68_face_landmarks.dat 权重为 95 Mb。我只需要人脸+地标检测,这个文件是否包含我需要的冗余信息?

-一个算法问题:点(地标)的收敛取决于人脸检测的边界框,smb可以解释一下,它是如何完成的吗?我们在边界框内拟合平均面的点,然后我们正在寻找其邻域中的每个地标最佳位置?这个小区多少钱?

感谢任何帮助

最佳答案

-It is possible to use in mobile/web application library dlib in order that it works in real time ? I am not familar with optimization settings and so on, that is why it is interesting how much restrictions there are.

-It is possible to use in my computer without optimisation SSE4 in order that it works in real time ?

Face landmark detection有两个步骤:face detection和face landmark detection on this face。最耗 CPU 的部分是第一步——检测人脸(运行 simple_object_detector),只有这部分从使用 AVX/SSE 中获益

为什么它很慢 - 对于 80x80 像素和更大的人脸尺寸,人脸检测会耗尽,如果您将一些高分辨率图像放入检测器,它将在不同比例的滑动窗口上花费大量时间。大多数情况需要在同一帧上有 1-3 个面孔,而现代移动相机的分辨率非常高。

因此,我建议您减小用于人脸检测的图像大小 - 缩小图像尺寸并根据感兴趣的区域进行裁剪。这将使您获得最大可能的性能优化。

下一个可能的步骤是让面部检测器不在不同的尺度上运行,但可能会进行 1-2 次迭代。看看这个问题 - 它描述了这个问题(dlib's scan_fhog_pyramid : set max_pyramid_levels)

-This file shape_predictor_68_face_landmarks.dat weights 95 Mb. I need just face+landmark detection, does this file contain redundant information according to my needs?

此文件只有在 iBug 数据集上训练的 68 个面部特征点的数据模型。它内部没有人脸检测模型。人脸检测模型在 dlib/image_processing/frontal_face_detector.h 文件中发布

是的,这个文件很大,但这是它质量的代价。您可以训练一些新的人脸界标检测模型(在 http://dlib.net/train_shape_predictor_ex.cpp.html 示例中描述),具有更少的界标点或更低的质量——这可以使您的文件更小

-One algorithm question...

要回答这个问题 - 请考虑阅读原始 ( http://www.cv-foundation.org/openaccess/content_cvpr_2014/papers/Kazemi_One_Millisecond_Face_2014_CVPR_paper.pdf ) 和 dlib/image_processing/shape_predictor.h 源代码

不久 - 在检测到人脸(找到边界框)后,形状预测器会在相对于人脸边界框的预训练位置搜索一些特征(图像像素值)。根据特征值,shape_predictor 将平均脸型更改为新的脸型(预测的脸型),并且对形状预测模型内的每个训练有素的回归树迭代进行此过程

关于c++ - Dlib。如何解决实时的优化约束?地标融合的想法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37878560/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com