python - 如何使用 scikit-learn 可视化两个类的边界/决策函数-6ren

python - 如何使用 scikit-learn 可视化两个类的边界/决策函数

转载作者：太空宇宙更新时间：2023-11-03 11:16:46

26

4

我是机器学习的新手，所以我仍然不明白如何在词袋案例中可视化两个类之间的边界。

我找到了以下示例来绘制数据

plot a document tfidf 2D graph

from sklearn.datasets import fetch_20newsgroups
from sklearn.feature_extraction.text import CountVectorizer, TfidfTransformer
from sklearn.decomposition import PCA
from sklearn.pipeline import Pipeline
import matplotlib.pyplot as plt

newsgroups_train = fetch_20newsgroups(subset='train', 
                                      categories=['alt.atheism', 'sci.space'])
pipeline = Pipeline([
    ('vect', CountVectorizer()),
    ('tfidf', TfidfTransformer()),
])        
X = pipeline.fit_transform(newsgroups_train.data).todense()

pca = PCA(n_components=2).fit(X)
data2D = pca.transform(X)
plt.scatter(data2D[:,0], data2D[:,1], c=newsgroups_train.target)
plt.show()

在我的项目中我使用 SVC 估计器

clf = SVC(random_state=241, kernel = 'linear')
clf.fit(X,newsgroups_train.target)

我试过用这个例子 http://scikit-learn.org/stable/auto_examples/svm/plot_iris.html但它在文本分类情况下不起作用

那么我怎样才能将两个类的边界添加到这个图中呢？

谢谢!

最佳答案

问题是您只需选择 2 个特征即可创建二维决策曲面图。我将提供 2 个示例。第一个使用 iris 数据，第二个使用 your 数据。

我在这里也写了一篇关于这个的文章: https://towardsdatascience.com/support-vector-machines-svm-clearly-explained-a-python-tutorial-for-classification-problems-29c539f3ad8?source=friends_link&sk=80f72ab272550d76a0cc3730d7c8af35

在这两种情况下，我都只选择了 2 个特征来创建绘图。

使用虹膜数据的示例1:

from sklearn.svm import SVC
import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm, datasets

iris = datasets.load_iris()
X = iris.data[:, :2]  # we only take the first two features.
y = iris.target

def make_meshgrid(x, y, h=.02):
    x_min, x_max = x.min() - 1, x.max() + 1
    y_min, y_max = y.min() - 1, y.max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
    return xx, yy

def plot_contours(ax, clf, xx, yy, **params):
    Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    out = ax.contourf(xx, yy, Z, **params)
    return out

model = svm.SVC(kernel='linear')
clf = model.fit(X, y)

fig, ax = plt.subplots()
# title for the plots
title = ('Decision surface of linear SVC ')
# Set-up grid for plotting.
X0, X1 = X[:, 0], X[:, 1]
xx, yy = make_meshgrid(X0, X1)

plot_contours(ax, clf, xx, yy, cmap=plt.cm.coolwarm, alpha=0.8)
ax.scatter(X0, X1, c=y, cmap=plt.cm.coolwarm, s=20, edgecolors='k')
ax.set_ylabel('y label here')
ax.set_xlabel('x label here')
ax.set_xticks(())
ax.set_yticks(())
ax.set_title(title)
ax.legend()
plt.show()

结果

使用您的数据的示例 2:

from sklearn.svm import SVC
import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm, datasets
from sklearn.datasets import fetch_20newsgroups
from sklearn.feature_extraction.text import CountVectorizer, TfidfTransformer
from sklearn.decomposition import PCA
from sklearn.pipeline import Pipeline
import matplotlib.pyplot as plt

newsgroups_train = fetch_20newsgroups(subset='train', 
                                      categories=['alt.atheism', 'sci.space'])
pipeline = Pipeline([('vect', CountVectorizer()), ('tfidf', TfidfTransformer())])        
X = pipeline.fit_transform(newsgroups_train.data).todense()

# Select ONLY 2 features
X = np.array(X)
X = X[:, [0,1]]
y = newsgroups_train.target

def make_meshgrid(x, y, h=.02):
    x_min, x_max = x.min() - 1, x.max() + 1
    y_min, y_max = y.min() - 1, y.max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
    return xx, yy

def plot_contours(ax, clf, xx, yy, **params):
    Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    out = ax.contourf(xx, yy, Z, **params)
    return out

model = svm.SVC(kernel='linear')
clf = model.fit(X, y)

fig, ax = plt.subplots()
# title for the plots
title = ('Decision surface of linear SVC ')
# Set-up grid for plotting.
X0, X1 = X[:, 0], X[:, 1]
xx, yy = make_meshgrid(X0, X1)

plot_contours(ax, clf, xx, yy, cmap=plt.cm.coolwarm, alpha=0.8)
ax.scatter(X0, X1, c=y, cmap=plt.cm.coolwarm, s=20, edgecolors='k')
ax.set_ylabel('y label here')
ax.set_xlabel('x label here')
ax.set_xticks(())
ax.set_yticks(())
ax.set_title(title)
ax.legend()
plt.show()

结果

重要提示:

在第二种情况下，绘图并不好看，因为我们只随机选择了 2 个特征来创建它。让它变得更好的一种方法如下:您可以使用单变量排名方法(例如方差分析 F 值测试)并从 22464 你最初拥有的。然后使用这些 top-2 您可以创建一个漂亮的分离曲面图。

关于python - 如何使用 scikit-learn 可视化两个类的边界/决策函数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50305223/

26

4

0

文章推荐： c# - 从 Active Directory 检索安全组的安全权限

文章推荐： android - Maven + AndroidAnnotations 生成但无法访问类

文章推荐： c# - 银光 + 位图缓存 : can't get it to work

iphone - 边界] 横向时不改变
我编写了一个应用程序，它有一个 UIViewController，它在纵向模式下显示另一个 UIViewController，在横向模式下显示不同的 UIViewController。当我去风景时，
iphone - UISegmentedControl 边界
我想为 UISegmentedControl 提供以下方面: 注意灰色背景 View ，以及分段控件未选定项目的白色背景。但是，如果我为 UISegmentedControl 提供白色背景，我会得到
javascript - 可排序的容器/边界
我正在尝试为我的可排序项目创建边界。我看过这个问题/答案: jquery sortable keep within container Boundary 并尝试将我的 JS 以此为基础，但无论出于何种
Java JFrame 边界
我正在尝试编写执行以下操作的代码:如果我单击起始位置为 (100,100) 的字符串 C(JLabel)，该字符串将在 JFrame 的边界内移动。代码本身并不难实现，但我遇到了问题为 JLabel
应用约束后快速获取 View 边界
我有一个 .xib 文件，其中包含我想用来播放视频文件的 View 。该 View 具有配置其大小和位置的约束。现在我需要获取这些来配置我的视频播放器: let slide1: OnboardingS
swift - MKMapView 边界
我将从 Google map 转到 Apple map 。 Google map 能够根据东北和西南坐标更新相机，如下所示: let bounds = GMSCameraUpdate.fit(GMSC
Android 为我的图片添加圆角线？边界
这个问题在这里已经有了答案: Border over a bitmap with rounded corners in Android (6 个答案) 关闭 6 年前。如何为我的图片添加圆角边框？
Java AWT 边界
我有一个任务是使用java.awt.Graphics绘制一定数量的圆圈。绘制圆圈相当简单，但我只应该在圆圈出现在可见区域内时绘制圆圈。我知道我可以调用方法 getClipBounds() 来确定绘图
html - 过渡方向 - 边界
我在设置过渡时遇到问题，目前它是从上到下(它是悬停时显示的边框)。我希望过渡从中间开始并传播到侧面，或者至少从任何一侧开始并传播到另一侧... 我的导航菜单 anchor 使用导航链接类! * {
C++: vector 边界
我来自 Java，目前正在学习 C++。我正在使用 Stroustrup 的 Progamming Principles and Practice of Using C++。我现在正在使用 vecto
C++循环展开，边界
我有一个要展开的循环: for(int i = 0; i < N; i++) do_stuff_for(i); 展开: for(int i = 0; i < N; i += CHUNK) {
与子类型一起使用的 Scala View 边界？
Scala 中是否有类似 View 绑定(bind)但可以匹配子类型的东西？由于 Scala 中的 View 没有链接，我目前有以下内容: implicit def pimpIterable[A,
javascript - map 边界!如何检查地址是否位于边界内？
网站用户输入地址。如果地址在边界内，则“合格”。如果地址超出边界，则“不合格”。是否有现有的小部件或代码可以执行此操作？有人知道实现这一目标的第一步吗？感谢您的任何意见。最佳答案哇，反对票是怎
haskell - 加密和 ByteString 边界
我有以下测试应用程序: import Codec.Crypto.AES import qualified Data.ByteString.Char8 as B key = B.pack "Thisis
java - JFrame - 设置位置/边界？
我正在尝试添加一个 JButton，但它与进度条水平对齐。如何将 JButton 对齐到下面的线上？另外，我试图将所有组件分组到不同的组中，但我不确定如何执行此操作。有谁知道吗？最佳答案要简单分
python - 查找相框的 Canvas 边界
假设我们有一个像上面这样的相框。从中心开始，如何找到可用于绘制的面积最大的矩形(矩形中的所有像素必须为 rgb(255,255,255)？我需要找到图中所示的A点和B点的x和y坐标。我的方法之一是
c# - 类(class)边界
这可能是一个愚蠢的问题，但当我创建一个类时，我应该如何正确设置其中属性的边界。例子:如果我有这门课 class Product { private string name; publ
javascript - 如何获得 map 边界？
我正在从 leaflet 迁移回来，如果我需要 map 绑定(bind)，我使用以下代码: var b = map.getBounds(); $scope.filtromapa.lat1 = b.ge
ios - UIView 边界/框架与绘制矩形不匹配
我正在学习如何创建自定义 UIView。我正在制作的这个特定 View 包含几个按钮。我注意到，当我从惰性实例化 block 中调用frame/height属性时，我得到的值是128，但是当我调用dr
java - 反转 JFrame 边界
我正在尝试制作一个弹跳球。设置的边界允许球在超出框架边界后从起点开始。我无法让球弹起来。一旦击中边界(框架的外边缘)，如何让球弹起？我相信问题出在 moveBall() 方法中。主类导入 java

首页

博学

6Ren·AI

商城

python - 如何使用 scikit-learn 可视化两个类的边界/决策函数

使用虹膜数据的示例1:

使用您的数据的示例 2:

重要提示: