scikit-learn - LinearSVC 变换的阈值如何工作？-6ren

scikit-learn - LinearSVC 变换的阈值如何工作？

转载作者：行者123 更新时间：2023-12-01 05:08:28

25

4

我使用 LinearSVC 作为决策树分类器的预处理步骤。我运行 LinearSVC
然后我做变换(X)。我注意到特征数量从大约 35 个减少到 9 个。我想知道实际选择了哪些特征。

我知道默认情况下，transform(X) 与 threshold='mean' 一起使用。有人可以告诉我它如何确定是否保留该功能的示例吗？

这是我的 coef_。
array([[ -2.45022173e-01, -8.61032928e-02, -2.39513401e-03, -2.07443644e-02, 2.49547244e-03, -3.14133367e-02, 7.09627000e-03, 3.94563929e-03, 6.78145800e-02, 1.59497586e-01, -1.24063075e-01, -4.79223418e-02, -3.70412138e-02, 4.39187481e-02, 1.30004636e-02, -2.31911643e-03, -1.63937709e-03, -2.18402321e-03, -2.65601394e-03, 1.48259224e-02, -6.15157373e-02, -3.65242492e-04, 8.10479000e-02, -1.58338535e-01, 5.06225924e-03, 1.16183358e-03, 6.44170055e-02, -2.56651350e-03, 1.62029008e-01, -1.69785296e+00, -1.91045465e+00, -1.64206237e+00, -1.80735175e+00, -1.39504546e+00, -1.66709852e+00], [ 4.14083584e-01, 2.03703885e-01, 4.82783739e-03, 7.90756359e-02, -1.45063508e-03, 1.05486236e-01, -3.01145160e-01, -7.81145855e-03, -3.39445309e-01, -5.66603101e-01, 2.41489561e-01, 3.11615301e-01, -3.59607168e-01, -4.04092005e-01, -3.18262477e-03, 8.14224001e-04, 8.64216590e-04, 6.59107091e-03, 5.48336293e-03, -1.76329713e-02, 2.33854833e-01, -1.00455178e-01, -5.00175471e-02, 4.81448974e-02, 3.13891484e-01, 3.54014313e-03, 3.32840843e-01, 6.85018177e-05, -6.75410702e-01, -1.03258781e-01, 2.59870671e-01, -3.03956500e-01, -1.58732859e-01, -3.89772985e-01, -2.55624888e-01], [ 1.06132321e-01, 1.23617156e-01, 1.40819416e-03, 1.06118853e-01, 5.11221833e-04, -1.68780545e-01, 9.27425326e-02, 3.52220207e-03, 2.12134293e-01, 3.54667378e-01, 1.22840976e-01, -4.21232679e-01, 3.55037449e-01, -2.06715803e-01, 6.18856581e-02, -4.63662372e-03, -5.04710160e-04, -4.65594740e-04, 1.01529235e-02, 1.15598254e-03, 4.49951214e-02, 2.20830485e-01, -1.01269555e-01, 3.03514605e-01, -1.27056578e-01, -2.17123757e-02, -2.51044202e-01, 7.19562937e-03, -6.74304600e-01, 2.47410746e-01, -7.76792375e-02, 2.26260621e-01, 3.83972532e-01, 4.35143804e-01, 3.50074110e-02], [ 6.33038442e-02, 3.71367520e-01, -1.21238483e-02, -5.92230089e-02, -2.69617795e-03, 2.44885573e-01, -1.12043386e-01, -1.05526224e-01, -9.88583026e-02, -6.09121814e-01, -5.16313417e-01, 2.83500385e-01, 2.04390765e-01, 9.13454922e-01, 2.12522482e-02, 4.67960378e-03, 3.78514732e-03, -1.89184862e-03, -2.35710741e-02, 2.77863999e-02, 5.93172013e-01, -3.98200956e-01, 2.04199614e-01, -6.20399607e-02, 1.19732985e-01, 1.16674647e-01, -1.27517918e-03, -4.23253804e-03, -1.82480535e+00, 9.29959444e-01, 1.21162165e+00, 1.09899835e+00, 7.42987354e-01, 9.61956169e-01, 8.72089435e-01], [ 2.98336593e-01, 1.36166556e-01, 8.55303000e-04, 1.13137553e-01, -4.11417197e-03, 2.59650136e-01, 7.87008264e-02, 7.22415689e-03, -3.64334467e-02, -2.57473176e-02, -1.01132206e-01, -4.52864069e-02, 8.62911851e-03, -1.01396648e-01, -1.71810251e-01, 2.87556170e-02, -5.75335168e-03, -1.31809609e-03, 2.27847222e-02, -1.64198532e-02, -8.11859436e-03, -2.60700154e-02, 1.74207263e-01, 1.10324971e-01, 6.65055594e-02, 4.11639440e-03, -9.68050856e-02, 4.32464307e-02, 1.26432150e+00, 2.80210335e-02, 1.30525549e-01, 4.34196521e-01, -2.46460632e-01, 3.85467301e-01, -2.58179093e-02]])我已经阅读了文档。我不确定的是这个“平均值”是如何计算的。是特征手段的均值吗？如果我有 5 个类和 35 个特征，则每个类的该特征的系数将不同。我应该先找到特征的均值，然后再找到这些特征的均值吗？

最佳答案

来自 documentation :

用于特征选择的阈值。 保留重要性大于或等于的特征，而丢弃其他特征。 如果是“中值”(对应“平均值”)，则阈值是特征重要性的中值(对应平均值)。也可以使用缩放因子(例如，“1.25*mean”)。如果无且可用，则使用对象属性阈值。否则，默认使用“mean”。

这里的重要性由系数给出。

关于scikit-learn - LinearSVC 变换的阈值如何工作？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26764249/

25

4

0

文章推荐： java - 如何将组件添加到JFrame子类的子类中

文章推荐： regex - 字符串中的智能模式匹配

文章推荐： java - 连接到其他 PC 的 TCP 套接字服务器时出现问题

文章推荐： jquery - Rails Ajax 使用 RJS 隐藏/显示切换链接

r - 将长向量中的元素剪裁到 +/- 阈值
我正在用 R 编写程序。我卡在这里。我有像这样的矢量 X=c(84.05, 108.04, 13.95, -194.05, 64.03, 208.05, 84.13, 57.04) 我想在用 180
Android ACTION_MOVE 阈值
我正在编写一个应用程序，该应用程序涉及使用手指或手写笔在屏幕上书写。我有那部分工作。在 ACTION_DOWN 上，开始绘制；在 ACTION_MOVE 上，添加线段；在 ACTION_UP 上，完成
python - 如何在opencv(阈值)中改变轮廓形成的区域
我正在尝试构建 OCR 以从图像中提取文本，我正在使用轮廓来形成文本字符的边界，经过几次更改 cv2.threshold 的试验后，我在形成文本字符的边界时得到了最适合的轮廓。 #files = o
c++ - 带掩码的 OpenCV 阈值
我正在尝试使用 OpenCV 的 cv::threshold函数(更具体 THRESH_OTSU )，只是我想用蒙版(任何形状)来做，以便在计算过程中忽略外部(背景)。图像是单 channel (必
python - 适应不同闪电条件的 OpenCV 阈值
对于学校项目，我试图用 Python 编写一个程序来跟踪学生的运动。为了做到这一点，我正在使用 OpenCV。在互联网上查找了一些教程后，我注意到几乎每个人都使用阈值来实现这一点，因为几乎每一步都需
jestjs - 测试报告为缓慢的开 Jest 阈值
我使用 jest 来驱动 selenium 测试，它报告一个需要 12 秒的测试缓慢(持续时间以红色突出显示)。在这种情况下，12 秒就可以了。如何将阈值配置为 30 秒？最佳答案 Jest is
python - 基于特定距离(阈值)的两个列表的交集
我想找到 list1 中与 list2 中的值足够接近的值(基于指定的阈值)，即与下面的代码类似的功能。然而，与 pyhton 的 set 交集相比，下面的 intersect_with_thresh
具有多个系列的 Jquery flot 阈值
我正在尝试创建一张图表上有两个系列并带有阈值选项的浮线图。我知道当我只有 1 个系列时如何启用阈值(就像这里 http://people.iola.dk/olau/flot/examples/thre
javascript - 获取计算的直方图 bin 阈值
我已正确应用 d3 (v 4.0) 直方图函数对数据数组进行分箱。我的代码如下所示: var bins = d3.histogram() .domain([data_points_min,
Mysql 全文 50% 阈值
我正在使用带有自然语言全文的 Mysql FULLTEXT 搜索，不幸的是，我遇到了 FULLTEXT 50% 阈值，如果给定的关键字出现在总行数的 50% 时间，则不允许我搜索行。我搜索并找到了一
Javascript math.round 阈值
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 8 年前。 Improve th
动态数据值的 JavaScript float 阈值
这是我的绘图数据 var data = [{ data: [[4, 80], [8, 50], [9, 130]], color: "r
opencv - 什么是 Canny 阈值？
是否可以制作Canny忽略短边还是忽略低梯度边？在我的例子中，我将卡片放在木头上，并在 canny 之后看到木结构的许多边缘 canny 函数中的两个阈值有什么用？最佳答案 Large intens
c++ - 带掩码的 OpenCV 阈值
我正在尝试使用 OpenCV 的 cv::threshold 函数(更具体的 THRESH_OTSU)，只是我想使用掩码(任何形状) ), 以便在计算过程中忽略外部(背景)。图像是单 channel
audio - 根据音频(阈值、频率)缩放图像
我正在寻找根据提供的音频、频率范围(例如 20hz-1000hz)和阈值缩放 PNG 文件，以获得平滑的效果。例如，当有脚踢时，比例平滑到 120%，我想让那些音频可视化器，如 dubstep 等.
scala - Spark mllib f1score 阈值
我正在尝试找到最佳阈值，以使我的逻辑回归具有最高的 f1 分数。但是，当我写下以下几行时: val f1Score = metrics.fMeasureByThreshold f1Score.fore
javascript - x 轴上的 float 阈值
我使用 Flot 创建了一个实时(每 10 毫秒更新一次)垂直样条图。图表可见here on Codepen 。我包括了 Flot multiple threshold plugin ，但我希望阈值使
python - Pandas dataframe 阈值——如果超过则保持数字固定
我有一个数据框，其中包含从第 1 天到第 7 天的三个人(John、Terry、Henry)的分数。 1 2 3 4 5 6 7
opencv - 多级 (4) Otsu 阈值
我正在尝试实现多级 Otsu 阈值，更具体地说，我需要 3 个阈值/4 个类。我知道关于 SO 的 2 个类似问题:#34856019 和 #22706742。问题是我没有得到好的结果:我已经阅读了
python - opencv 阈值 THRESH_BINARY 对彩色图像有何作用？
The documentation在 THRESH_BINARY 上说: dst(x,y) = maxval if src(x,y) > thresh else 0 这对我来说并不意味着这不适用于彩色

首页

博学

6Ren·AI

商城

scikit-learn - LinearSVC 变换的阈值如何工作？