gpt4 book ai didi

python - 图像识别,如何开始

转载 作者:太空宇宙 更新时间:2023-11-03 21:34:23 25 4
gpt4 key购买 nike

作为我的理学学士学位论文的一部分,我必须在视频源上使用图像识别。

我已将 openCV 和 Tensorflow——特别是 Inception 训练模型——确定为两个选项,但我不知道如何从那里继续。基本上我需要的是传递一个字符串,例如“keys”,如果前 5 个结果之一是“keys”,则返回一个 bool 值。

顺便提一下,我在线上了一个 python 类(class),因为两者都使用 python。此外,我在 Java 方面拥有非常丰富的经验,过去两年我们一直在我们的大学中使用它。

请注意,我不需要创建一个全新的图像识别系统,我需要使用一个系统来告诉我我的相机看到了什么。

此外,虽然它是视频,但我认为处理实际的视频馈送会更加困难。我想到的是从 30 帧中挑选出 1 帧(假设是 30fps 的视频输入)并对其运行图像识别。

提前致谢!

最佳答案

如果您通读 this tutorial,您的项目应该相当简单,特别是“使用 Python API”部分。 classify_image.py 生成的前 N ​​个结果被转换为人类可读的文本 here在此代码块中:

top_k = predictions.argsort()[-FLAGS.num_top_predictions:][::-1]
for node_id in top_k:
human_string = node_lookup.id_to_string(node_id)
score = predictions[node_id]
print('%s (score = %.5f)' % (human_string, score))

对于您的示例,您希望将 FLAGS.num_top_predictions 设置为 5,并且您希望累积前 5 个 human_string 值,如下所示:

top_k_strings = []
top_k = predictions.argsort()[-FLAGS.num_top_predictions:][::-1]
for node_id in top_k:
human_string = node_lookup.id_to_string(node_id)
top_k_strings.append(human_string)
score = predictions[node_id]
print('%s (score = %.5f)' % (human_string, score))

最后,您可以检查“keys”是否是 imagenet 生成的前 5 个字符串之一,并返回一个 bool 值作为

return "keys" in top_k_strings

此外,如果您对人类可读类别的完整列表感兴趣,您可以找到它们 here

关于视频,您可能是对的,您必须对视频序列进行子采​​样以跟上帧速率。一些实验和计时测试会让您了解所需的子采样率。

祝你好运!

关于python - 图像识别,如何开始,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40311268/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com