gpt4 book ai didi

algorithm - 使用 Z-score 查找趋势、热门话题

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:07:05 24 4
gpt4 key购买 nike

我正在开发一个基于 Z 分数(标准分数)寻找趋势、热门话题的系统 http://en.wikipedia.org/wiki/Standard_score .

我遇到了一个问题:

例如:我有 2 个主题:

  • 主题 1:

    +第 1 天:10 次互动

    +第 2 天:20 次互动

    +第 3 天:20 次互动

    +第 4 天:20 次互动

  • 主题 2:

    +第 1 天:100 次互动

    +第 2 天:200 次互动

    +第 3 天:200 次互动

    +第 4 天:200 次互动

我使用 Z-score 计算第 4 天第 2 个主题的分数 z,问题显示在这里:

如果我为每个主题划分 2 个数据交互,则 2 个主题的 z-score 几乎相同(0,66)(我的意思是我对主题 1 使用 10,20,20,20 交互,对主题 2 使用 100,200,200,200 交互)

但我很困惑,这是 Z-score 工作的正确方式,否则我必须包括所有数据交互才能计算

最佳答案

如果您将一个主题的所有分数相乘得到另一个主题的分数(在您的情况下,主题 2 的分数都是主题 1 分数的 10 倍),那么您计算的第 4 天的 z 分数将与两个话题。无论如何,如果您想分别考虑每个主题以找到一个主题的重要“热门”日子,那么学生 t 分布 http://en.wikipedia.org/wiki/Student%27s_t-distribution是比简单的 z 分数更好的方法,因为 t 分布在根据样本数量正确估计标准差时考虑了偏差。

关于algorithm - 使用 Z-score 查找趋势、热门话题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29496127/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com