gpt4 book ai didi

traminer - 不等长序列的可变 indel 成本

转载 作者:行者123 更新时间:2023-12-04 20:10:02 30 4
gpt4 key购买 nike

我正在使用最佳匹配算法在 TraMineR 中进行序列分析。不幸的是,我的 由于右删失数据,序列长度不等 .我的序列的最小长度是 5,最大长度是 11。长度的变化对于我感兴趣的序列之间的差异没有意义。因此,我想将不等长度对序列之间整体差异的影响保持为尽可能小。

我在 Stovel 和 Bolan (2004 (1)) 中读到了这个问题的可能解决方案,他们使用了 可变插入成本 取决于序列的长度是否相等。因此,对于相同长度的序列,他们使用固定的插入成本,对于不等长度的序列,他们使用减少的成本,“大约是固定成本的四分之一”。

我的问题是:
一般来说,缺失应该如何在 TraMineR 中编码?作为无效元素还是应该在字母表中包含缺失状态?
正如 Stovel 和 Bolan 所介绍的那样,TraMineR 中是否有应用可变插入成本的选项?如果是,如何做到这一点?

(1) 斯托维尔、凯瑟琳和马克·博兰。 2004 年。“住宅轨迹:使用最佳对齐来揭示住宅流动性的结构。”社会学方法与研究 32(4):559-598。

最佳答案

目前,无法使用可变的 indel 成本(取决于序列的长度是否相等)。我对这种方法持怀疑态度,因为如果我理解得很好,距离度量的定义会根据所涉及的序列而变化(因为插入成本发生了变化)。因此,不遵守三角不等式。从概念的角度来看,我认为我们应该始终使用相同的比较标准,从而使用相同的距离定义。

关于traminer - 不等长序列的可变 indel 成本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18959175/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com