algorithm - 基于离散点的手势检测算法-6ren

algorithm - 基于离散点的手势检测算法

转载作者：行者123 更新时间：2023-12-02 09:02:14

我正在尝试解决将人类生成的手势与已知手势匹配的问题。人工生成的手势将由一系列点表示，这些点需要插入到路径中并与现有路径进行比较。下图显示了我要比较的内容

您能否提供一些我可以读懂的资源或概念来帮助我指出正确的方向，以建立可匹配这两条路径的算法？我之前没有这样做的经验，因此任何见解将不胜感激。

最佳答案

接收输入
每隔一段时间测量一次输入。每隔xx毫秒，请测量用户的手/手指/手写笔的坐标。

存储模式和输入
模式（预期输入）
修改图案。目前，它是一个连续的“功能”，但是很难测量输入。间隔使用离散点。此间隔可能非常短，具体取决于您要求手势的准确性。实际上，它应该很短；要比较的点越多越好（我将在下一部分中对此进行更好的解释）。
输入（从用户那里接收）
在测量输入时，输入测量间隔必须足够短，以使每个接收到的连续输入点对都足够接近以与预期点进行比较。
想象一下，用户非常快速地执行某些手势（并在您的输入阅读器仅读取三个帧的时间内完成了手势）。模式和输入无法可靠地比较：

为避免这种情况，输入阅读器的间隔必须相对较短。但是，这可能不是一个大问题，因为大多数硬件甚至可以读取最快的人类手势。
回到模式：它们应该总是足够详细，以包括比任何可能的输入更多的点。预期点越多，精度越高。如果用户缓慢移动，则输入将有更多点；如果它们快速移动，则输入将更少。
考虑一下：完成一个手势将为您提供图案所包含的输入帧的一半。用户以“正常”速度移动，因此，为简化算法，您可以将模式“变钝” 2倍，然后直接将输入坐标与模式坐标进行比较。
这种方法比想到的替代方法容易（请参阅下一节）。

模式“密度”（坐标频率）
如果期望点数量较少，则必须进行近似以匹配输入。
这是一个“极端”示例，但它证明了这一概念。给定此模式和输入：

无法将点3r与点2或点3进行可靠比较，因此必须使用点2、3和3r的某些功能来确定3r是否在正确的路径上。现在考虑相同的输入，但是图案的密度较高：

现在，您不必妥协，因为3r本质上肯定在手势的模式上。模式密度的略微降低会使其很好地匹配输入。

定位
相对定位
您可能不希望比较手势的绝对位置（例如在触摸屏上），而希望在某个空间平面内的任何位置允许该手势。为此，必须将输入的起点与某个坐标系相关联。

正常化
为了便于用户使用，允许在“大小”范围内完成手势。您不希望比较原始数据，因为输入平面的大小可能与模式平面的大小不匹配。
在x和y方向上对输入进行归一化以匹配图案的大小。不要保持宽高比。

根据先前的项目符号，将输入与坐标系相关
查找任意两个输入点之间的最大水平和垂直距离（分别称为RecMaxH和RecMaxV）
找到任意两个图案点之间的最大水平和垂直距离（分别称为ExpMaxH和ExpMaxV）
将所有输入点的x坐标乘以ExpMaxH/RecMaxH
所有输入点的y坐标乘以ExpMaxV/RecMaxV

现在，您可以比较两组更相似的点。规范化可以比这更详细。例如，您可以一次标准化3个点的集合以获得难以置信的相似图像（但是您可能必须对每个图案进行此操作，然后比较所有差异的总和以找到最可能匹配的图案）。
我建议将所有手势的模式存储为相同大小的图形。在测量输入与可能的模式匹配的接近度时减少了计算量。

何时测量输入
用户驱动
想象一下一个按钮，单击/激活该按钮后，它将使您的程序开始测量输入。这与Google的语音搜索类似，后者不会持续记录和搜索。而是说“ Ok Jarvis”或单击方便的麦克风图标，然后开始说出您的查询。
好处：

简化算法
防止用户无意中触发事件。想象一下，您所说的每个单词是否都经过分析并作为搜索查询的一部分发送给Google。有时，您只是无意做任何事情。

缺点：

不太人性化。用户必须竭尽全力来触发手势录制。

例如，如果您要编写手势搜索（荒谬的示例），则这可能是更好的实现方法。没有人希望他们做出的任何举动都被解释为您的应用程序中的一个动作。但是，如果您正在编写Kinect风格或基于手势的游戏，则可能需要不断记录并寻找手势。
不变
您的程序以指定的间隔恒定地记录手势坐标（可以简化为“记录是否有运动，否则不存储坐标”）。您必须做出一个决定：在确定当前存储的动作不是可识别的手势之前，您将记录多少个“帧”？
将坐标存储在缓冲区中：排队的时间是您愿意记录的最大帧数的1.5倍或2倍（请谨慎）。

一旦确定此缓冲区中存在与模式匹配的帧序列，就执行该手势的结果并清除队列。

如果下一个手势可能是最近手势的“选项”，则将应用程序状态记录为“当前正在等待____手势的选项”，然后等待该选项出现。

如果确定缓冲区中的前x帧可能不匹配某个模式（由于其顺序或位置），则将其从队列中删除。

好处：

允许更动态地处理手势
用户输入自动识别

缺点：

更复杂的算法
更重的计算

如果您要编写基于实时输入运行的游戏，那么这可能是正确的选择。

算法
如果您使用的是用户驱动的识别：

在允许的时间范围内（或直到用户表明已完成）记录所有输入
要评估输入，请降低图案的密度以匹配输入的密度
将输入与坐标系相关
标准化输入
使用函数比较的方法（此计算的松散度取决于您：标准偏差，方差，值的总差异等），然后选择最小差异可能性。
如果没有任何可能的相似度足以满足您要求的阈值（您必须决定），请不要接受输入。

如果您使用恒定测量：
在缓冲区中，将max_sequence_size（由您决定）的序列视为在frame_multiples（由您决定）的每一个倍数处开始的可能手势。例如，如果我所有可能的手势最长不超过20帧，并且我相信每5帧就会开始一个新手势（并且我不会在这5帧中丢失任何关键数据），所以我将比较每个部分缓冲区到所有可能的手势（0-19、5-24、10-29等的部分）。当frame_multiples减少时，这会增加计算量。对于完美的测量，frame_multiples为1（但这可能不合理）。

希望您喜欢阅读这个答案，就像享受编写它一样。我以前从未做过此事，但您以一种不常发生的方式激起了我的兴趣。请编辑并完善我的答案！如果有一部分看起来不完整，请添加它。我对（尤其是经验更丰富的）回应和批评感到非常好奇。

关于algorithm - 基于离散点的手势检测算法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20821358/

文章推荐： Oracle Data Integrator 标量函数用法

文章推荐： binding - 当源为 null/未定义时 KnockoutJS 绑定(bind)

文章推荐： qt - 在 Qt 中与 libpng 链接

文章推荐： python - 计算两个不同数字的倍数之间的差

iPhone UIPickerView 手势
我将如何向 uipickerview 添加手势事件来更改选项卡？我必须创建一个自定义类，但是，我不知道如何处理 uipickerview。我当前在 uiviews 中存在手势来执行此操作，但我在使用
android - 手势 - 手指运动时显示坐标
我需要创建一个 Activity ，当您在屏幕上拖动手指时，显示 XY 坐标(手指移动的位置)。谁能帮帮我？最佳答案 OnTouch 您需要为想要识别拖动的任何 View 实现一个 OnTouchL
opencv - 手势/姿势识别的特征提取方法
我目前正在开发手语识别应用程序，我想在其中使用隐马尔可夫模型作为分类阶段，这意味着我将对手势/姿势进行分类以获得相关的字母或单词。我目前已经完成了检测手的第一阶段。目前我可以获得许多可用于我的机器学
Python PyQT 手势
我想在我的应用程序中启用 PyQT 手势。有人有一个示例或一些简短的代码可以演示在 PyQT 应用程序中使用手势控制吗？我尝试谷歌搜索，但只能找到一篇关于自定义手势的帖子...我还没有那么远，我只是
在开始屏幕上使用的 Android 手势
什么 Android Api 用于在 Android 的开始屏幕上向左或向右滚动？最佳答案最简单的方法是检测“Fling”手势。 android API 有一个内置的检测器，用于检测基本手势，如滑
图像上的 Android 手势
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
firefox - 如何禁用 Firefox 手势？
我讨厌 Firefox 的手势，我只想点击，但如果我的 Action 在点击过程中抖动，就会一团糟! 如何禁用 Firefox 手势？最佳答案您需要更改配置，您可以通过键入 about:confi
ios - 在我自己的应用程序中使用“滑动后退”手势
我正在构建一个iOS应用程序，该应用程序需要与在Safari中来回滑动时看到的效果相同的效果。滑动后退时，前景面板会移开，但背面的面板也会移动一点。与Yahoo Weather应用程序中的水平滚动非
java - 从屏幕外滑动检测触摸/滑动/手势
我想做一些类似默认通知状态栏的东西(可从屏幕顶部扩展)。当用户在屏幕外触摸手机并将手指向下移动时，如何检测触摸？ OnTouch 监听器仅在用户在屏幕上启动时工作。最佳答案在 html-js 中，
c# - 手势 FreeDrag 性能
我有一个简单的问题，我正在尝试为 Windows Phone 制作一款大型游戏，但我仍然遇到一个重要的瓶颈/问题/性能不佳。我用过 mango profiler，但我没有发现任何问题，事实上它在我的
java - Android 手势、单笔划和多笔划产生不一致的结果
我在按照此处的手势教程进行操作时遇到了一个非常奇怪的问题:http://developer.android.com/resources/articles/gestures.html . 在 Gestu
ios - 滑动 ios 手势
我正在尝试创建一个简单的应用程序，用户可以在其中将手指保持在屏幕上的同时向左然后向右滑动。我想计算他们总共进行了多少次滑动，包括方向的改变。我正在使用带方向的 uiswipegesture，但它只在新
objective-c - CGAffineTransformmakeScale + 手势
我有一个问题。有一个uiview，它是通过手势控制的(可以水平移动)。虽然这个 uiview 很小，但一切都很好。在使用 CGAffineTransformScale 缩放它之后，奇怪的事情开始了:
iphone - UIWebview 手势 iOS
如何在 UIWebview 中识别用户 touch、tap 和 double tap。是否有可用的代表，例如触摸开始等？最佳答案这是在webview上实现单击和双击的代码 UITapGesture
ios - 禁用 UIScrollView 手势
我创建了一个自定义 ScrollView 类，它使用两个 subview ，它们可以滚动(启用分页)以在屏幕上当前显示任何一个 View 。我想做的是更改它，以便第二个 View 仅在点击特定按钮时
c++ - 向事件窗口发送 GID_ZOOM 手势
如何向当前事件窗口发送缩放手势？我尝试创建一个 GESTUREINFO 结构，但我不知道如何正确传递该结构。到目前为止，这是我得到的。 GESTUREINFO gi; POINT pt; ZeroMe
Android NYTimes 滑动动画/手势
纽约时报有一个非常有趣的翻页功能。您可以从左向右/从右向左滑动以查看其他项目(这很容易实现)。即使您没有超过阈值， View 也会随着您的手指移动并在您抬起手指后回滚到初始 View 。他们是怎么做到
ios - 如何以编程方式模拟 "pinch out"手势？
我正在开发 iOS 应用。我添加了一个 UIPinchGestureRecognizer 来监听双指张开 Action 。 [[self view]addGestureRecognizer:[[UI
ios - 通过单击按钮重置 iOS 手势
我有一个允许用户平移和放大图像的应用程序。我认为，没有太多麻烦，用户可以让自己进入一种状态，他们放大了图像的一部分，并希望将所有内容重置回“基态”(即，将所有翻译和分别重新缩放回 0 和 1)。我正
android - 手势 onSingleTapConfirmed 奇怪的行为
我相信你聪明的头脑和强大的机器人技能。我有点卡住了。我有以下情况。我创建了用于学习如何使用手势和 Canvas 的应用程序。想法很简单，当我在屏幕上点击一次，我点击的地方应该出现气泡(R.draw

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

algorithm - 基于离散点的手势检测算法