gpt4 book ai didi

weka - 特征组合

转载 作者:行者123 更新时间:2023-12-04 22:52:03 25 4
gpt4 key购买 nike

我有一个特征集列表(40 个特征),我的想法首先是根据我可以获得的所有组合评估分类器。但是,经过我的一些计算,我发现组合将达到数百万!因此,这将需要永远!!!!

我读到了使用随机搜索方法选择随机特征的能力。但是,每次运行随机搜索时,我都会得到相同的功能集。我需要更改种子编号或任何选项吗??

另外,使用随机搜索是否有效并且可以替代选择所有组合的方法???

非常感谢您的帮助专家。

非常感谢,

艾哈迈德

最佳答案

当你想在 WEKA 中进行属性选择时,你应该考虑 2 个算法,搜索器和属性评估器(我稍后会讲到)。

正如您所说,也许您不能尝试穷举搜索,因为它需要很长时间,有贪婪的替代方法来获得好的结果(取决于问题),例如Best first(基于爬山)。您评论的选项(随机搜索)是另一种制作选择子集的方法,它进行随机迭代以选择将被评估的子集。

为什么您会得到相同的选定属性子集?因为 Random search 总是选择相同的子集,并且评估器会确定最佳子集(最终输出)。但是,如果我更改 seed 参数,它应该会更改。也许……也许不是。为什么?因为如果算法执行了足够多的迭代(尽管它以不同的种子开始),它将获得与前一个相同的子集(收敛),并且评估器将选择与前一个执行相同的子集。

如果您不想在选择器输出中收敛,只需更改 seed,但选择较小的 search percent 以限制探索并获得不同的结果。

但是,在我看来,如果你总是得到相同的结果是因为评估者(我不知道你使用的是什么算法)已经确定这个子集是给定你的数据集的“最佳”。我还建议您尝试另一种选择器,例如 Best firstGenetic search 作为您的搜索方法。

关于weka - 特征组合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14577246/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com