gpt4 book ai didi

machine-learning - 重复项在数据集中有用吗?

转载 作者:行者123 更新时间:2023-11-30 08:47:06 27 4
gpt4 key购买 nike

我下载了Skin Segmentation Data Set发现里面有很多重复的内容。
例如,此行 0 128 0 2 出现了 199 次。

请提供一些例子,什么时候重复是好的,什么时候是坏的。

最佳答案

当然可以,因为如果它是随机样本,则代表数据中的基本分布,这会告诉您该特定值具有更高的概率。删除重复项只会使数据集变得毫无用处。

关于machine-learning - 重复项在数据集中有用吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34935940/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com