machine-learning - 如何获得逻辑回归特征对于特定预测的相对重要性？-6ren

machine-learning - 如何获得逻辑回归特征对于特定预测的相对重要性？

转载作者：行者123 更新时间：2023-11-30 08:29:18

25

4

我正在使用逻辑回归(在 scikit 中)来解决二元分类问题，并且有兴趣能够解释每个单独的预测。更准确地说，我感兴趣的是预测正类的概率，并衡量每个特征对于该预测的重要性。

使用系数(Beta)作为重要性衡量标准通常是一个坏主意 as answered here ，但我还没有找到一个好的替代方案。

到目前为止，我发现的最好的选择是以下 3 个选项:

蒙特卡洛选项:修复所有其他特征，重新运行预测，用训练集中的随机样本替换我们想要评估的特征。多次执行此操作。这将为正类建立基线概率。然后与原始运行的正类概率进行比较。差异是功能重要性的衡量标准。
“留一”分类器:要评估某个特征的重要性，首先创建一个使用所有特征的模型，然后创建另一个使用除被测试特征之外的所有特征的模型。使用这两个模型预测新的观察结果。两者之间的区别在于该功能的重要性。
调整后的测试版:基于 this answer ，通过“系数的大小乘以数据中相应参数的标准差”来对特征的重要性进行排序。

所有选项(使用测试版、蒙特卡罗和“留一法”)对我来说似乎都是糟糕的解决方案。

蒙特卡罗依赖于训练集的分布，我找不到任何文献支持它。
“留一”很容易被两个相关特征所欺骗(当一个特征缺失时，另一个特征会介入进行补偿，并且两者的重要性都将被赋予 0)。
调整后的测试版听起来似乎有道理，但我找不到任何文献来支持它。

实际问题:在做出决策时，使用线性分类器解释每个特征的重要性的最佳方法是什么？

快速说明#1:对于随机森林来说，这是微不足道的，我们可以简单地使用预测+偏差分解，如 this blog post 中详细解释的那样。。这里的问题是如何使用线性分类器(例如逻辑回归)做类似的事情。

快速说明#2:stackoverflow 上有许多相关问题( 1 2 3 4 5 )。我无法找到这个具体问题的答案。

最佳答案

如果您想了解特定决策中特征的重要性，为什么不逐步模拟decision_function(由 scikit-learn 提供，这样您就可以测试是否获得相同的值)步？线性分类器的决策函数很简单:

intercept_ + coef_[0]*feature[0] + coef_[1]*feature[1] + ...

特征i的重要性就是coef_[i]*feature[i]。当然，这类似于查看系数的大小，但由于它与实际特征相乘，而且它也是在幕后发生的事情，因此它可能是您最好的选择。

关于machine-learning - 如何获得逻辑回归特征对于特定预测的相对重要性？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34529513/

25

4

0

文章推荐： javascript - 在 Javascript 中，获取匹配正则表达式的长度

文章推荐： java - Spring security @secure 不适用于角色层次结构

沿框架旋转点的算法(相对)
我们有一个应用程序，我们可以在其中设计标签，然后根据设计创建图像并将其发送到打印机。图像在通过 TCP/IP 发送之前被制成字节流。简而言之，我们有一个旋转设置，可以自动计算标签上不同元素的位置。而
Javascript 相对 URL
我们在 IIS7 中有一个 MVC3 应用程序:http://mydomain.com/myapplication/ javascript 中的相对 URL 是什么: http://mydomain.
javascript - 相对+绝对定位
我的例子:http://jsfiddle.net/kwnk8qup/ 我的代码: container(父 div
绝对定位后的 CSS 相对
如何将元素放置在右侧，并保持后面元素的持久位置？我想在没有 Efficiently ... 的情况下将 text-align: right 对齐到右侧，并保留 t2 和 t3 元素之间的空间。当我
Python 相对 __import__
假设我有一个包含以下文件的模块包。一个空文件 C:\codes\package\__init__.py 和一些重要文件: 一个位于C:\codes\package\first.py def f():
C++ MOUSEEVENTF_MOVE 相对
我正在尝试使用以下代码在屏幕上相对移动光标: input.type = INPUT_MOUSE; ZeroMemory(&input, sizeof(input)); input.mi.mouseDa
CSS 相对 + float
我排列了 3 个 div；中心 div 有许多 position:absolute 图像(它们重叠——一次显示一个图像；其余的是 display:none;对于 jQuery 交叉淡入淡出，这不是密切
sql - 选择具有最高(相对)时间戳的所有行
我在 SQL 2000 数据库中有以下简化的表结构: ID AppName Key Value EffectiveDate -- ------- ----- ------- ---
Nginx 相对 URL 到绝对重写规则？
给定以下配置: server { listen 80; server_name site.com; location /proxy { proxy_pa
wpf - 相对 URI 路径无法正常工作
我正在使用这些方法动态加载图像和资源目录，但它们并不适用于所有情况 new Uri(@"pack://application:,,/Images/lession_tab.png"); 此方法不适用于图
sqlite - SQLite更新ONE记录非常(相对)缓慢
在插入/更新许多行时，我知道SQLite的“问题”，但事实并非如此。我正在更新包含约250条记录的表中的ONE一行（由PK索引）中的ONE字段。查询通常需要200毫秒左右的时间。听起来很少，但很大。
java - 如何在android中滑动布局(线性/相对..)
如何向左或向右滑动线性布局。在该线性布局中，默认情况下我有一个不可见的删除按钮，还有一些其他小部件，它们都是可见状态，当向左滑动线性布局时，我需要使其可见的删除按钮，当向右滑动时，我需要隐藏该删除按钮
OpenGL - GlVertex 相对/绝对位置
Imagen 我有一个 2D 点 (x,y) 列表，它们在我的简单游戏中描述了 2D 地形。然后我让 glVertex() 在 GL_POINTS 模式下绘制所有这些点。然后我有一个球，它也有它的
php - 选择(相对)较大的数据库表
我正在使用 Google CloudSQL 并具有以下简单代码: ;dbname=', 'root', '' ); $db->setAttribute ( PDO::ATTR_ERRMODE, PDO
java - 路径、相对、直接
我知道有几个类似的问题，但是，其中的示例并没有说明问题，或者我无法从中获利 - 我真可耻。所以我的问题是在带有 GUI 的简单应用程序中加载图像。例如: 我在 "D:\javaeclipseprog
html - 相对 div 与父表格单元格重叠
我对放置在表格单元格内的 div 有疑问。单元格具有固定的高度和 div 相对于 height:100% 定位。 jsfiddle example td { height:80px;
python - 相对 XPath 错误地选择了循环中的相同元素
我正在抓取一些数据。我需要的数据点之一是日期，但包含此数据的表格单元格仅包括月份和日期。幸运的是，年份被用作对表格进行分类的标题元素。出于某种原因，year = table.find_elemen
html - 相对 DIV 宽度和高度
我想要一个 DIV，最大 90% 高度或 90% 宽度。我只想将图片作为背景放入 DIV 中，并且完整的 svg-image 应该是可见的。在移动设备和桌面设备上。 CSS: .camera {
html - CSS 相对-绝对位置
我是网页设计新手，想了解 CSS 中定位的概念。我对相对和绝对定位元素有一些了解。在下面的 fiddle 中，我有一个作为的父级.当我做 p position:absolute ，边框崩溃不像我
html - 动态调整图像大小，相对/绝对定位？
我在调整图像高度相对于浏览器窗口的大小时遇到了一些严重的困难——宽度可以很好地调整大小，但高度保持不变。我尝试过 height: 100% 和 height: auto，以及 height: 10

首页

博学

6Ren·AI

商城

machine-learning - 如何获得逻辑回归特征对于特定预测的相对重要性？