gpt4 book ai didi

python - Tensorflow body 部位识别

转载 作者:行者123 更新时间:2023-12-01 08:53:56 25 4
gpt4 key购买 nike

我是一名对 ML 和使用 Tensorflow 非常感兴趣的开发人员,但尽管我已经完成了所有教程,但我真的很难开始构建自己的模型,并希望你们能帮助回答一些可能很漂亮的问题简单。

我正在尝试构建一种算法,可以从图像中检测 body 上的特定点(肩膀、手腕等),但是我不确定模型的输出应该是什么,我的训练数据是一组图像和点的 x,y 值列表,我希望返回图像上点位置的预测(类似于面部识别)。

但是我在构建这个时有几个问题:

1- 我的应用程序的输出应该是什么?我希望算法返回每个点最有可能的 x,y 位置,但不确定如何在 tensorflow 中表示它,我是否需要在每个像素的输出中使用大量张量,并且正确的像素值为 1?

2-我如何处理不同尺寸的图像,因为输入张量将具有预定数量的特征,我的算法如何接受任何尺寸的图像?

3- 如何判断图像上是否没有有效点?是否只是在我的训练集中包含空图像?

我希望这些问题有意义,我感谢那些花时间阅读它的人!这对我理解 Tensorflow 以及在追求 ML 兴趣方面取得良好进展有很大帮助!

最佳答案

这可以通过各种不同的方式来完成,具体取决于您想要如何编码数据的语义。我尝试举一个非常简单的例子,但可能不会有最好的结果:

1 - 您可以将人体姿势表示为顶点列表,它是一个向量。例如,这可能是:

[left_shoulder,
right_shoulder,
torso,
...]

每个顶点都是一个 x, y 元组,因此您的输出尺寸将为 [vertex_count, 2]vertex_count * 2(扁平版本)。因此,输出将是每个顶点的 x,y 位置。这是一个回归问题,因为您的输出尝试 generate continuous values 。您还可以添加已识别 body 姿势的置信度值。这样做的优点是,如果没有识别到​​姿势,则能够不显示/处理姿势,并且在解释模型的输出时可以使用简单的截止。

2 - 处理不同尺寸图像的最简单方法是添加预处理步骤:只需调整图像大小以适合您训练的模型。

3 - 是的,这可能是一个很好的起点。也许还有那些不适合框架的 body ,很难标记。

@EighteenthVariable 在 Medium 上分享的文章也是一个很好的开始,可以帮助您更好地理解。

关于python - Tensorflow body 部位识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52906028/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com