gpt4 book ai didi

machine-learning - 数据集之间的差异

转载 作者:行者123 更新时间:2023-11-30 09:53:12 25 4
gpt4 key购买 nike

问题描述如下:

我有来自不同年份的 2 个数据集(2013 年数据集和 2014 年数据集),数据是多元的,每个数据集包含 38 个属性,我想找出这些连续年份中两个数据集之间可能发生的任何差异/增量,这个差异应该是一个数值。

到目前为止,我已经应用了以下技术:

1)方差分析(这告诉我存在差异,但它没有告诉我差异有多大)

2)Wilcoxon-Mann-Whitney U 检验(与方差分析相同的问题)

3)计算数据集平均值之间的均方误差。

问题:

1)他们是否可以应用任何其他方法/测试来为我提供数据集之间差异的数值?

2)如果我将 2013 年数据集标记为“1”,将 2014 年数据集标记为“2”,那么经过训练对这些数据集进行分类的神经网络的权重是否可以用于以某种方式找到数据集之间的差异?

注意:由于保密协议(protocol),我无法在此处共享数据。

最佳答案

不知道你是否找到答案了。

您尝试过使用 RMSE 吗?您可以为数据集的每一列创建一个分数,然后将它们组合起来以获得整个数据的平均分数。

这不是一个完美的方法,但在比较多个数据集时,它应该给出差异的尺度。

如果您确实找到了比我建议的更好的答案,请告诉我,因为我对此感兴趣。

祝一切顺利。

关于machine-learning - 数据集之间的差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40857969/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com