gpt4 book ai didi

traminer - 序列符号的定义...(A), (A>B), and (A) - (A>B)

转载 作者:行者123 更新时间:2023-12-05 01:02:02 25 4
gpt4 key购买 nike

希望快点....

关于 seqefsub() 的输出操作,请指出输出符号的定义。

更具体地说,括号中的例如

  • (A)意味着什么;
  • 大于号 (A>B)意味着什么;
  • (A)-(A>B) 中的连字符意味着什么。
  • Section 10的优秀 User Guide有例子,但我可能在某处遗漏了一个明确的定义声明。

    引用 Section 10.2 中的例子指南中, (Parent)-(Parent>Left) 之间的概念区别是什么?而只是 (Parent>Left) ?

    谢谢,

    戴夫

    吉尔伯特评论后更新....

    在试图澄清我在用户指南的第 106 页上可能遗漏的内容时,我认为我正在寻找的解释 - 或者至少是确认 - 是遵循以下框架的内容。为可能的笨拙冗长道歉。

    这里的上下文是 seqefsub()结果出现在控制台中....
    (A)这是状态 A 出现为 的次数第一状态 ,而不是作为任何后续状态。也就是说 - 它计算 A 在第一列中出现的次数。我在这里假设我没有错过另一个配置选项,该选项首先计算这种类型的所有后续状态。如果有请告诉我。
    (A>B)这是从 A 到 B 的事件(即状态变化)发生的次数。此计数指的是事件 任何地方 在序列中。我建议这与上面的州计数略有不同,假设我没有无意中歪曲事情。我注意到可以将约束设置为输出单次或多次出现。
    (A)-(A>B)这计算状态 A 作为第一个状态出现的次数,以及 A 到 B 事件在序列中的任何位置发生的次数。这包括在第一个状态之后立即发生的 A 到 B 事件,并且可以包括干预 其他州 在第一个状态 A 和事件 A 到 B 之间。

    我希望这会有所帮助,我希望这是一组正确的陈述(基于比我原来的问题晚的调查)。

    在吉尔伯特的评论请求示例之后的第二次更新......

    对于真实数据集......(其中 J 和 I 代替 A 和 B)
    > data   
    V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11
    1 I J J I J J I K J D J
    2 G K R I J D J R I J N
    3 K K I R M M K R J K I
    4 R R B R I G R G R G G
    5 J J J J J J J T Z J Z
    6 R K R K M R R J J J R
    7 J I I I I I I I I I I
    8 J J J J J J J J J J R
    9 J R J R J R J J I S R
    10 J J J J J I J J J J J
    11 G J J J J I I I R J J
    12 I I D M D I I D I I D
    13 R M R R J J J J J J J

    然后
    > dataseq <- seqdef(data)

    > dataseqe <- seqecreate(dataseq)

    > datasubseq <- seqefsub(dataseqe, pMinSupport = 0.05)

    > datasubseq[1:10]


        Subsequence   Support Count
    1 (J) 0.3846154 5
    2 (J>I) 0.3846154 5
    3 (R>J) 0.3846154 5
    4 (J>R) 0.3076923 4
    5 (I>J) 0.2307692 3
    6 (J)-(J>I) 0.2307692 3
    7 (K>R) 0.2307692 3
    8 (R) 0.2307692 3
    9 (D>J) 0.1538462 2
    10 (G) 0.1538462 2

    所以 ....

    1) 5 个 J 状态的计数 (J)仅适用于第一列/出现,而不适用于任何后续 J 状态。共有 57 个 J 状态。

    2) 5 个 J 状态到 I 状态变化事件的计数 (J>I)是总计数(对于此约束选项),无论何时发生。

    3) 3 个 J 状态的计数,然后是 J 状态到 I 状态的子序列 (J)-(J>I)是第 7 行(第 1 列和第 2 列)、第 9 行(第 1 列和第 8 列和第 9 列)以及最后第 10 行(第 1 列和第 5 列和第 6 列)中的事件计数;最后两个案例在 (J) 之间具有干预状态和/或事件和 (J>I) .

    回到问题 - 这是正确的和预期的行为,以及正确的解释。如果是这样,为什么状态计数与事件/状态更改计数在不同的基础上完成?

    最佳答案

    在您的示例中,事件序列源自状态序列对象 dataseqseqecreate(dataseq) .由于您不提供 tevent参数,默认 tevent = "transition"使用(见 help(seqecreate))。使用此值,事件被定义为从状态 A 的转换。到状态 B并标有 A>B .此外,标记为 A 的特定事件与序列开始相关联以指示序列开始时的状态。因此,尽管使用了相同的符号,A在事件序列中是一个事件---开始事件---不应与 A 混淆在它是一个状态的状态序列中。

    以上是针对tevent="transition"的选项。例如,使用 tevent="state" ,事件将是法术的开始并标记为 A指示处于状态 A 的咒语的开始.在这种情况下,事件 A可以发生在序列中的任何地方,而不仅仅是在开始时。

    现在关于括号。它们指示转换(或事务),转换被定义为引发状态更改的一组同时发生的事件。例如:
    (a,b)表示两个事件 ab发生在同一时间点,
    (A>C)意味着我们有单个事件 A>C在时间点。
    (a)-(b)表示长度为 2 的序列,其中事件 a事件发生前 b .

    更新以回应 Stephan 的评论

    让我们考虑以下示例

    (seq <- seqdef('HHHAABBBAAGGG', stsep=''))
    ## Sequence
    ## [1] H-H-H-A-A-B-B-B-A-A-G-G-G

    seqecreate(seq, tevent='state')
    ## [1] (H)-3-(A)-2-(B)-3-(A)-2-(G)-3

    seqecreate(seq, tevent='transition')
    ## [1] (H)-3-(H>A)-2-(A>B)-3-(B>A)-2-(A>G)-3

    状态序列有5个咒语,2个在状态 A每个州都有 1 个 H , B , 和 G .现在有不同的可能性可以将此状态序列转换为事件序列。 tevent='state'tevent='transition'这只是众多可能性中的两种。

    使用 tevent='state'我们得到一个事件序列,其中事件 (A)发生两次,因为我们在状态 A 中有两个咒语.这两个法术中的每一个都由同一个事件引发 (A)这不考虑先前的状态。

    查看使用 tevent='transition' 获得的事件序列选项,我们观察到 A 中的咒语这里是由两个不同的事件发起的 (H>A)(B>A)这说明了先前的状态。

    第一个事件序列有两个子序列 (H)-(A) ,对应于子序列 (H)-(H>A)(H)-(B>A)在第二个事件序列中。

    关于traminer - 序列符号的定义...(A), (A>B), and (A) - (A>B),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27207301/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com