作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用最佳匹配算法在 TraMineR 中进行序列分析。不幸的是,我的 由于右删失数据,序列长度不等 .我的序列的最小长度是 5,最大长度是 11。长度的变化对于我感兴趣的序列之间的差异没有意义。因此,我想将不等长度对序列之间整体差异的影响保持为尽可能小。
我在 Stovel 和 Bolan (2004 (1)) 中读到了这个问题的可能解决方案,他们使用了 可变插入成本 取决于序列的长度是否相等。因此,对于相同长度的序列,他们使用固定的插入成本,对于不等长度的序列,他们使用减少的成本,“大约是固定成本的四分之一”。
我的问题是:
一般来说,缺失应该如何在 TraMineR 中编码?作为无效元素还是应该在字母表中包含缺失状态?
正如 Stovel 和 Bolan 所介绍的那样,TraMineR 中是否有应用可变插入成本的选项?如果是,如何做到这一点?
(1) 斯托维尔、凯瑟琳和马克·博兰。 2004 年。“住宅轨迹:使用最佳对齐来揭示住宅流动性的结构。”社会学方法与研究 32(4):559-598。
最佳答案
目前,无法使用可变的 indel 成本(取决于序列的长度是否相等)。我对这种方法持怀疑态度,因为如果我理解得很好,距离度量的定义会根据所涉及的序列而变化(因为插入成本发生了变化)。因此,不遵守三角不等式。从概念的角度来看,我认为我们应该始终使用相同的比较标准,从而使用相同的距离定义。
关于traminer - 不等长序列的可变 indel 成本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18959175/
我是一名优秀的程序员,十分优秀!