gpt4 book ai didi

machine-learning - 连续/数字特征的互信息

转载 作者:行者123 更新时间:2023-11-30 09:23:29 28 4
gpt4 key购买 nike

我必须计算连续/数字特征的互信息。我想基于此应用特征选择。功能集描述如下

feature1:可以采用 1 - 10000 之间的任何值功能2:测量在某件事上花费的时间 - 因此可以假设除整数(大)之外的任何值....我有这些特点。

我对此应用互信息公式感到困惑。维基百科说积分需要连续变量。

在应用 MI 之前我需要离散化特征吗?

最佳答案

我认为你需要在应用 MI 之前离散化特征

当在连续变量中应用信息增益进行特征选择时,会选择一个分割点来将变量的值空间分割成不同的部分,这需要评估所有可能的分割点以获得该特征的最佳分割点。我认为在特征选择的互信息中是相同的,您可以选择将连续空间离散化为某个离散化值,如果值空间是平滑的,我认为这会做同样的事情

关于machine-learning - 连续/数字特征的互信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23211395/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com