matrix - 用于拟合 scikit 邻居/半径分类的预计算矩阵-6ren

matrix - 用于拟合 scikit 邻居/半径分类的预计算矩阵

转载作者：行者123 更新时间：2023-12-01 06:05:14

30

4

我使用预先计算的指标使用 Scikit-Learn 的最近邻/半径分类。这意味着，我将成对距离的 n_samples_train x n_samples_train 矩阵传递给分类器的拟合方法。

现在我想知道为什么必须这样做。使用 knn 学习只是意味着“存储样本”，但距离的计算应该只在稍后的泛化过程中进行(在该步骤中，我当然会计算训练样本和测试样本之间的距离矩阵，因此大小为 n_samples_train x n_samples_test 的矩阵)。

例如，在 SVM 的情况下，我将一个预先计算的矩阵(Gramian，一个相似性矩阵)传递给 smv.SVC 对象的 fit 方法。然后进行优化，找到支持向量等等。在那里，该矩阵在训练期间是绝对必要的。

但是我看不出为什么需要一个预先计算的矩阵来拟合邻居/半径分类。

有人可以给我一个相关的提示吗？

我很想跳过使用 scikit learn 计算 knn 的训练矩阵。

最好的问候和谢谢。 :-)

最佳答案

这是旧的，但我在搜索相关问题时碰巧找到了它。

本质上，这是一个性能问题。以一次拟合 k 个邻居/半径分类器的情况为例，然后使用它对多个不同的测试点集进行分类。如果未预先计算内核矩阵，则每次调用 fit() 时都必须计算内核矩阵。这些分类器的实现方式利用了一个事实，即您正在使用正(半)定函数，并且可以使用它来加速最近邻居/半径搜索使用 kd 树或球树的新点，它构建了一个结构，该结构对到每个子树之外的点的距离进行了限制。对于 n 个样本和 k 个邻居(至少对于球树)，可以在 iirc O(k*log(n)) 时间内构建这种结构。因此，通过提前做一些工作，可以显着加快新点的分类。

要使用实用的解决方案回答您的问题，如果您想使用自定义指标，则无需传递预先计算的距离矩阵。如果您传递一个可调用作为度量，距离矩阵仍将在一定程度上预先计算 - 但它会在拟合过程中透明地发生，并且实际上应该比使用蛮力计算所有样本对之间的距离更有效你自己(注意，如果你有稀疏输入，分类器仍然会使用蛮力。它仍然会使用多个核心，因此可能比你自己做更可取，但它的行为会有所不同。)

所以总结一下:你完全正确，预先计算的距离矩阵对于拟合一般的 k 最近邻分类器并不是绝对必要的。然而，通过预先计算它——无论你是做它还是传递一个可调用的——随后的分类效率更高。 Sklearn 显然选择预先计算自定义指标——可能是因为使用 python 函数 n*(n-1)/2 次的开销使得该路由比使用高度优化的内置指标慢得多，其中许多是部分或完全在cython中实现。但是您不需要在拟合之前将其计算为显式步骤。

关于matrix - 用于拟合 scikit 邻居/半径分类的预计算矩阵，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40998306/

30

4

0

文章推荐： IE7下的jQuery下拉菜单

文章推荐： perl - Net::SFTP perl rsa 认证

文章推荐： python - PyPy 重新加载(...)错误

文章推荐： java - 如何获得斐波那契递归的时间

mysql查询路径/半径
我有 2 个表:city 和 city_neighbor。 city 包含所有城市的列表，而 city_neighbor 包含给定城市的邻居:insert into city_neighbor (ci
Linux、LDAP、半径
我需要一点帮助来了解我使用 RADIUS+LDAP 的无线登录是否足够安全。我有这样的基础设施:PC 客户端 (Linux) + ASUS AP Wireless + FreeRadius 和 OP
ios - 使用动画更改 GMSCircle 半径
我正在为我的应用程序使用 Google Maps iOS sdk。在我的应用程序中，用户可以绘制一个栅栏(一个圆圈)，然后可以编辑以更改和调整圆的半径。它的大小调整正确但是当半径值改变它的瞬间时，不
javascript - 传单和 MongoDB 半径
我想为我的搜索表单使用传单标记(用于 latLng)和 slider (用于半径)。 mongodb 部分将像 location: { $geoWithin: { $centerSpher
android - 带背景的 ImageView 半径
我有一个有背景的 ImageView。我需要将 border-radius 设置到我的 ImageView。我在另一个 XML 文件中使用以下代码并将其设置为 android:src 但是当我设置背景
postgresql - 在postgis中按中心点、半径、内角和方位角绘制扇区
我正在使用 Bing Maps API 构建一个 javascript 应用程序，我想根据中心点和扇形参数构成扇形几何图形。我在 PostgreSQL 数据库中有一个表“points”，顶部是 Po
c++ - 修改 ATriggerSphere 半径？
我在我的游戏中创建了一个 ATriggerSphere 实例，并将其放置在我角色的位置，如下所示: //Create activate trigger radius activateRadiusTri
ios - OpenCV 以像素为单位获取坐标/半径
我有对图像应用一些变换以检测圆圈的代码 (GaussianBlur->cvtColor(gray)->canny->HoughCircles) 结果我得到了vector circles;数组。如果我
css - 推特引导导航栏中的圆 Angular 半径
在我使用 bootsrap 3 的 Rails 应用程序中，我的导航栏上似乎有一个奇怪的 4px 边界半径，我似乎无法摆脱它。我试过了 .navbar { border-radius: none
ios - 如何根据屏幕尺寸更改 icarousel 半径？
你好我想做半圆旋转轮。所以我为此使用了iCarousel。我的问题是如何根据屏幕尺寸改变轮子的半径。这些是我的约束。这个红色 View 是 iCarousel View 最佳答案有一个值 iCa
android - 为什么角(半径)不能不同？
我正在尝试: 没有角半径。所有角半径 == 10dp。是否有可能以及如何指定角:10dp(左上)10dp(右上)0 0(下)？最佳答案在 Android 开发者中 http://devel
javascript - 如何获取用户绘制的圆心的经度/经度/半径
我正在使用来自 https://developers.google.com/maps/documentation/javascript/examples/drawing-tools 的这个例子使用户能
c# - Mysql 半正矢过程(半径)使用中心点
我对 MySql 相当陌生，我想要创建一个过程，在其中我可以插入任何邮政编码和距离，然后取回该距离内的所有邮政编码。我确实找到了一个公式并尝试根据我的需要 reshape 它，但我无法做到。我所拥有的
Android KitKat 获取 Toast 半径？
我通过 RomainNurik 使用库向用户显示 Undo-Toast(如在 Gmail 应用程序中) 在 KitKat 之前，toast 选项是矩形的，而在 KitKat 中，toast 消息是圆角
ios4 - 带有方形(0 半径)角的 UIModalPresentationFormSheet？
默认情况下，iPad 模态表单获得圆角。在一些 Apple 的应用程序中，例如 iTunes，表单具有完美的方角。是否有一种相对简单的方法可以删除不会让我被 App Store 拒绝的圆角半径？最佳
android - 如何在谷歌地图中缩小/缩小到 x km 半径
我的数据库有各种兴趣点。我希望用户根据他们的位置看到他们。还有3个按钮，显示2km/5km/15km半径内的兴趣点。我无法对这些半径实现放大功能。所以我正在寻找缩放系数(从 2 到 21)和物理距离(
css - 在选项卡导航器中为选项卡的下 Angular 设置圆 Angular 半径
使用 CSS，我可以在选项卡导航器中设置选项卡顶 Angular 的圆 Angular 半径: .tabstyle { corner-radius: 10;
css - 仅适用于特定 Angular 的 Angular 半径
我有这个标签，我只想在右上角和左上角做圆 Angular 。但它最终绕过了所有 4 个 Angular 。我做了什么: 和我的 pageStyles.css 文件是: .my
javascript - 在 Google map 标记周围添加圆/半径
有人可以帮助我在我的谷歌地图标记周围添加一个圆/半径吗？ function createMarker ( size, i,id,lat,lng,pin,title,counter,image,pr
html - 内容溢出 Chrome 中的 div 半径
我的网站布局很奇怪(由我的客户设计)，但我开发得很好。问题是 Chrome(版本 22)不工作，但在 Firefox(版本 16)和 IE 9 中工作。问题出在 colRight 中，有两个 di

首页

博学

6Ren·AI

商城

matrix - 用于拟合 scikit 邻居/半径分类的预计算矩阵