python - 获取分类报告，说明使用 10 折交叉验证的多项式朴素贝叶斯的分类精度和召回率-6ren

python - 获取分类报告，说明使用 10 折交叉验证的多项式朴素贝叶斯的分类精度和召回率

转载作者：太空狗更新时间：2023-10-29 23:58:33

24

4

我有以下代码，它使用 NB 分类器解决多类分类问题。该函数通过存储精度并稍后打印平均值来执行交叉验证。相反，我想要的是一个分类报告，它指定了分类准确率和召回率，而不是最终的平均准确率分数。

   import random
   from sklearn import cross_validation
   from sklearn.naive_bayes import MultinomialNB

   def multinomial_nb_with_cv(x_train, y_train):
        random.shuffle(X)
        kf = cross_validation.KFold(len(X), n_folds=10)
        acc = []
        for train_index, test_index in kf:
            y_true = y_train[test_index]
            clf = MultinomialNB().fit(x_train[train_index],         
            y_train[train_index])
            y_pred = clf.predict(x_train[test_index])
            acc.append(accuracy_score(y_true, y_pred))

如果我不执行交叉验证，我所要做的就是:

    from sklearn.metrics import classification_report
    from sklearn.naive_bayes import MultinomialNB

    def multinomial_nb(x_train, y_train, x_test, y_test):
        clf = MultinomialNB().fit(x_train, y_train)
        y_pred = clf.predict(x_test)
        y_true = y_test
        print classification_report(y_true, y_pred)

它给了我这样的报告:

        precision    recall  f1-score   support

      0       0.50      0.24      0.33       221
      1       0.00      0.00      0.00        18
      2       0.00      0.00      0.00        27
      3       0.00      0.00      0.00        28
      4       0.00      0.00      0.00        32
      5       0.04      0.02      0.02        57
      6       0.00      0.00      0.00        26
      7       0.00      0.00      0.00        25
      8       0.00      0.00      0.00        43
      9       0.00      0.00      0.00        99
     10       0.63      0.98      0.76       716

    avg / total       0.44      0.59      0.48      1292

如何在交叉验证的情况下得到类似的报告？

最佳答案

您可以使用 cross_val_predict 生成交叉验证预测，然后使用 classification_report。

from sklearn.datasets import make_classification
from sklearn.cross_validation import cross_val_predict
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import classification_report

# generate some artificial data with 11 classes
X, y = make_classification(n_samples=2000, n_features=20, n_informative=10, n_classes=11, random_state=0)

# your classifier, assume GaussianNB here for non-integer data X
estimator = GaussianNB()
# generate your cross-validation prediction with 10 fold Stratified sampling
y_pred = cross_val_predict(estimator, X, y, cv=10)
y_pred.shape

Out[91]: (2000,)

# generate report
print(classification_report(y, y_pred))

             precision    recall  f1-score   support

          0       0.47      0.36      0.41       181
          1       0.38      0.46      0.41       181
          2       0.45      0.53      0.48       182
          3       0.29      0.45      0.35       183
          4       0.37      0.33      0.35       183
          5       0.40      0.44      0.42       182
          6       0.27      0.13      0.17       183
          7       0.47      0.44      0.45       182
          8       0.34      0.27      0.30       182
          9       0.41      0.44      0.42       179
         10       0.42      0.41      0.41       182

avg / total       0.39      0.39      0.38      2000

关于python - 获取分类报告，说明使用 10 折交叉验证的多项式朴素贝叶斯的分类精度和召回率，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31175140/

24

4

0

文章推荐： c# - 如何在属性网格中显示动态对象？

文章推荐： c# - 在 C# 中引用数组的一部分

文章推荐： python - NumPy 还是字典？

java - 捕获的屏幕截图附加到本地 Cucumber 报告，但不附加到 Jenkins 报告
@After public void afterScenario() { if (ScenarioManager.getScenario().isFailed()) {
mysql - Grails + BIRT 报告 - 将月份和年份作为日期传递到 BIRT 报告
我已将 BIRT 报告集成到 Grails 中并设计了一份报告。我的 grails 应用程序中有一个名为 startPeriod (仅限月份和年份)的参数，我想将其传递给 BIRT。然后 BIRT 调
oracle - 将 Oracle 报告 (.rdf) 转换为 BIRT 报告
我有一些 Oracle 报告 (.rdf)，正在考虑将其转换为 BIRT 报告。有没有办法将 .rdf 文件转换为 BIRT 报告设计文件？最佳答案完全自动化的解决方案可能是不可能的。您可以部分自
gcc - 为什么 gcc 4.1 + gcov 报告 100% 的分支覆盖率和更新的(4.4、4.6、4.8)报告 "p = new class;"行的 50%？
当 gcc 4.1(使用 gcov)下一行: p = 新类；报告为 100% 分支覆盖率为什么？因为启用了异常处理!!! 为了解决此问题，请指定: -fno-exceptions 在 g++
Bugzilla 报告
真的有好免费 BugZilla 报告工具？我发现 Web 界面上的默认搜索选项太有限了。我最大的问题是缺少 Order By 选项(一次只有 1 个字段，可供选择的字段集非常有限)。我已经做了一些谷
ColdFusion 报告
是否可以在 CFMX7 上运行 ColdFusion Report builder 生成的报告？更明确地说，是否可以将 CF7 中的报告生成引擎更改为 CF8？最佳答案我猜这可能很难做到。我记得
报告：2025年智能家居市场的机会将达到1190亿美元
根据Lucintel发布的新市场报告，智能家居市场的未来看起来很有吸引力，在家用安全、家电、娱乐、照明、HVAC、医疗保健和厨房应用中将带来许多机遇。由于COVID-19导致的全球经济衰退，
PHPCodeSniffer HTML 报告？
PHPCodeSniffer 是否生成 HTML 报告？如果不是呢？怎么办？目前，我可以运行 PHPCodeSniffer，但它只生成 XML 文件并在终端中显示结果。如何在 phpunit 中
PHPUnit 报告 PHPUnit_Framework_Exception
我在一个包中添加了一个简单的测试。按照手册中的建议，我尝试让 PHPUnit 加载配置: phpunit -c /app phpunit.xml 看起来像这样:
报告 R 中两个数据框之间的差异
我有两个从 csv 文件加载的数据框。基本上来自不同的环境但格式/列相似，它们的行/值可能有所不同。我想找到差异并在新的数据框中创建它们。两个数据框也将具有相同的顺序。我有 100 个要比较的文件。提
JUnit 报告——测试方法描述
我想看看是否有办法通过 javadoc 在我的 junit 报告中包含“描述性文本”。 JUnit 4 似乎不像 TestNG 那样支持 @Test 注释的“描述”属性。到目前为止，我所研究的只有一
Java Struts 报告
我正在使用操作、 Controller 、servlet struts 框架编写 Excel 报告。该报告非常拥挤，已经有大约 10 个单独的查询。由于报告发生变化，我需要再添加大约 10 个查询。有
OpenERP Jasper 报告
在放弃 Syleam 的 openerp jasper 模块后，我在 Nan Tic 的 jasper_reports 模块上苦苦挣扎。它一直给我一个错误: File "C:\Program Fil
php - 按每天按每月计数生成统计数据/报告
我希望创建一个简单的日历。每天由编码器生成条目计数并以日历样式查看。如一月、二月等。或按月显示全年。 database have date_added and encoder columns 我在将它
MySQL 报告 - 订单历史记录
我必须为报告创建 MySQL 查询。我有一个表history，它记录产品订单的状态更改。我有订单生命周期(订单流程)的以下状态:新、已确认、正在处理、已发货、已交付、已取消、已退回。订单不一定遵循此
mysql - 多个查询合而为一(报告)？
如何将多个查询合并为一个？例如: //Successful Sales: SELECT username, count(*) as TotalSales, sum(point) as Points
用于性能优化的 mysqltuner 报告
MySQL 优化技术的新手。请找到下面的 mysqltuner.pl 报告，并建议我应该更改 my.cnf 中的哪些变量以优化性能。还有一个问题- 我无法在我的 my.cnf 中找到一些变量，例如
java - 事件调度线程 - 报告
我想知道，我想将我的 Swing Worker 的某种形式的进度报告回主线程，以便我的界面可以使用随着进度增加而变化的标签进行更新，例如 checking 1/6... checking 2/6...
Magento Paypal 报告
我正在尝试在“报告”>“销售”下运行 Magento Paypal 结算报告，但每次我尝试运行该报告时，我都会收到消息“由于配置为空，无法获取任何内容” 我查看了“系统”>“配置”>“销售”>“付款方
MySQL 报告 - 编辑器
我想要一个工具来帮助创建 sql 查询(对于非 IT 人员)，例如 dbforge。我希望我们的非 IT 人员(例如运营)创建他们自己的 sql 查询。我的第二个目标是让他们能够按需执行这些查询。

首页

博学

6Ren·AI

商城

python - 获取分类报告，说明使用 10 折交叉验证的多项式朴素贝叶斯的分类精度和召回率