gpt4 book ai didi

computer-vision - 识别图片中的动物

转载 作者:行者123 更新时间:2023-12-04 07:01:34 27 4
gpt4 key购买 nike

我正面临一个具有挑战性的问题。在我工作的公司的院子里,有一个相机陷阱,可以拍下每一个 Action 。在其中一些图片中,有不同种类的动物(主要是深灰色老鼠)会对我们的电缆系统造成损害。我的想法是使用一些可以识别图片上是否有灰色鼠标的应用程序。理想情况下是实时的。到目前为止,我们已经开发了一种解决方案,可以为每个 Action 发送警报,但大多数警报都是错误的。您能否提供一些有关如何解决问题的可能方法的信息?

最佳答案

用技术术语来说,您上面描述的通常称为 事件检测 .我知道没有现成的方法可以一次解决所有这些问题,但是通过一点编程,即使您不想编写任何计算机视觉算法或类似的代码,您也应该做好准备。

高级管道将是:

  • 确保 您的视频质量足够 .灰老鼠听起来有点难,而且照片可能是在晚上拍摄的——所以你应该有足够的红外光等。但如果人类能分辨出警报是真是假,那你应该没问题。
  • 部署 运动检测和拍摄快照图像在运动时。看起来你已经完成了这部分,太棒了!详细说明您的设置可能会使其他人受益。您可能还需要仅从图像中裁剪运动区域,您这样做了吗?
  • 大楼 图片文件 ,包括您决定它们是假警报还是真警报( 标签 在机器学习用语中)。尝试为这两种情况收集至少几十张示例图像,并让它们代表现实世界的变化(你在白天也有问题吗?你所在的地区有降雪吗?)。
  • 图像分类从视频流快照中获取,以检查它是否是误报或包含吃电缆的坏生物。这听起来很难,但深度学习和机器学习正在飞速发展;您可以:
  • 部署您自己的神经网络,该网络构建在 caffe 等框架中或 Tensorflow (但你可能需要很多例子,我会说至少有几万个)
  • 使用识别一般对象的图像分类 API,如 ClarifaiImagga - 如果幸运的话,它会注意到快照显示的是一只老鼠或一只松鼠(松鼠会咬电缆吗?),但很可能在像这样的专门任务中,这些引擎会变得相当困惑!
  • 使用 自定义图像分类 API 服务 这通常比滚动你自己的神经网络更强大,因为它可以使用很多技巧来整理这些图像,即使你只为每个图像类别提供少量示例(此处为假/真警报); vize.it就是一个很好的例子(任何人都可以贡献更多这样的服务?)。

  • 实时方面有点开放,因为神经网络需要一些时间来处理图像——在使用公共(public) API 时,您还需要包括数据传输等,但如果您推出自己的 API,则需要花费大量精力来获得低延迟,因为框架默认针对吞吐量进行了优化(批量预测)。一般来说,如果您对约 1 秒的延迟感到满意并且拥有良好的互联网上行链路,那么您应该可以接受任何服务。

    免责声明:我是 vize.it 的共同创建者之一。

    关于computer-vision - 识别图片中的动物,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39877985/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com