gpt4 book ai didi

math - 如何获得趋势的标准化斜率

转载 作者:行者123 更新时间:2023-11-30 09:43:49 28 4
gpt4 key购买 nike

我正在分析社交网络中 6 周内用户与 userx 的距离。

注意:“无路径”意味着两个用户尚未连接(至少是 friend 的 friend )。

              week1      week2    week3    week4    week5   week6
user1 No path No path No path No path 3 1
user2 No path No path No path 5 3 1
user3 5 4 4 4 4 3
userN ...

我想了解用户与 userx 的连接情况。

为此,我最初想到使用回归斜率值进行解释(即回归斜率越低越好)。

例如;考虑user1user2它们的回归斜率计算如下。

用户1:

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
X = [[5], [6]] #distance available only for week5 and week6
y = [3, 1]
regressor.fit(X, y)
print(regressor.coef_)

输出为-2。

用户2:

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
X = [[4], [5], [6]] #distance available only for week4, week5 and week6
y = [5, 3, 1]
regressor.fit(X, y)
print(regressor.coef_)

输出为-2。

正如您所看到的,两个用户都获得相同的slope 值。但是,user2user1 早一周与 userx 连接。因此,user1 应该以某种方式获得奖励。

因此,我想知道是否有更好的方法来计算我的问题。

如果需要,我很乐意提供更多详细信息。

最佳答案

好吧,如果您想根据连接持续时间进行奖励,您可能需要花时间进行计算。最简单/最直接的方法就是将系数乘以时间:

outcome_measure <- regressor.coef_ * length(y)

如果将其除以 2,从概念上讲,它与曲线下面积 (AUC) 相同:

outcome_measure <- (regressor.coef_ * length(y))/2

因此,使用第一种方法会得到 -4 和 -6,使用第二种方法会得到 -2 和 -3。

有点离题,但如果您使用线性回归进行统计分析(不仅仅是为了获得系数),我可能会添加某种检查来确认其假设是否正确。

关于math - 如何获得趋势的标准化斜率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55275661/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com