- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
您只需复制/粘贴代码即可在您的环境中运行。
我找到的科学术语是成本最小化,而该算法应用精度最大化。那就是算法的目标是在准确率上获得最高分,而我不关心准确率,我关心的是不对某个类进行错误分类。
我知道以下将 CART 算法用于决策树,我如何更改它以强调误分类错误比误分类正例更危险。我知道术语是成本最小化,但我不确定如何应用它或在哪些书籍中搜索。
import numpy as np
import pandas as pd
from sklearn.datasets import make_classification
from sklearn.tree import DecisionTreeClassifier
X, y = make_classification(n_samples=1000,
n_features=6,
n_informative=3,
n_classes=2,
random_state=0,
shuffle=False)
# Creating a dataFrame
df = pd.DataFrame({'Feature 1':X[:,0],
'Feature 2':X[:,1],
'Feature 3':X[:,2],
'Feature 4':X[:,3],
'Feature 5':X[:,4],
'Feature 6':X[:,5],
'Class':y})
y_train = df['Class']
X_train = df.drop('Class',axis = 1)
dt = DecisionTreeClassifier(random_state=42)
dt.fit(X_train, y_train)
最佳答案
我只能想到两个选择:
增加Positive类的权重
DecisionTreeClassifier有一个参数可以让你改变每个类的默认权重。默认值是平衡的,这意味着所有类的权重都为 1。为了最大程度地减少假阴性,您可以为正类标记数据赋予更大的权重。
创建您的评分函数以尽量减少漏报
该算法计算每个类别的概率。如果你有两类分类问题,那么如果一个样本的概率>=0.5,那么它被打成1分,如果它<0.5,它被打成0分。
这些概率与经过训练的模型一起返回,您可以通过 dt.predict_proba
获取它们。因此,与其获取模型返回的评分标签,不如使用预测概率创建评分函数,以最大限度地减少成本矩阵上的假阴性。
关于python - 如何惩罚错误分类某个类别的决策树?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49131151/
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 6 年前。 Improve this qu
如果我使用 Eigen 的成员函数 Matrix3Xf 矩阵 myMatrix.middleCols(a, b) with a = 0, b = myMatrix.cols() -1,我得到了性能损失
我有一个关于 SEO 的小问题,尤其是对于 Google。在 WooCommerce 中,您可以将产品添加到类别中,也可以为产品添加产品标签。 所以我的问题是,当我有一个产品,例如梅赛德斯汽车,并将其
我正在制作一个网站,该网站将对 Internet 上数十万个其他网站的隐私政策进行审查。它的初始内容基于我对 CommonCrawl 的运行50 亿页网页转储和 analyzing all the p
我正在考虑使用 HTML5 数据属性来更轻松地为我的应用程序编写第三方脚本。因此,考虑两种情况: 页面上有 10'000 个 HTML 元素,如 Sticker . 还有其他 10,000 个 HTM
像这样在相应的设备上显示视网膜和非视网膜: 有效。但是 Google Pagespeed Insight 告诉我们在加载 CSS 之前它无法呈现它,我们因此受到惩罚。但是,仅在移动
我正在开发一个基于 Bootstrap 的响应式网站。主网站导航中的下拉菜单是通过单击而不是悬停打开的。每个部分没有索引内容,只有下拉列表中的特定页面链接。 如果内容位于: 是否会受到 SEO 惩罚
给定 vector 加法: NPNumber NPNumber::plus(const double o) const { vector c; for (double a : va
我正在使用带有 LogisticRegression 的嵌入式方法(L1 - Lasso)运行分类问题的特征选择过程。 我正在运行以下代码: from sklearn.linear_model imp
我是一名优秀的程序员,十分优秀!