Keras官方中文文档:性能评估Metrices详解-6ren

Keras官方中文文档:性能评估Metrices详解

转载作者：qq735679552 更新时间：2022-09-29 22:32:09

26

4

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Keras官方中文文档:性能评估Metrices详解由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

能评估。

使用方法。

性能评估模块提供了一系列用于模型性能评估的函数,这些函数在模型编译时由metrics关键字设置。

性能评估函数类似与目标函数, 只不过该性能的评估结果讲不会用于训练. 。

可以通过字符串来使用域定义的性能评估函数。

 
    ? 
   
         model. 
         compile 
         (loss 
         = 
         'mean_squared_error' 
         , 
        
         optimizer 
         = 
         'sgd' 
         , 
        
         metrics 
         = 
         [ 
         'mae' 
         ,  
         'acc' 
         ])

也可以自定义一个Theano/TensorFlow函数并使用之。

 
    ? 
   
         from 
         keras  
         import 
         metrics 
        
         model. 
         compile 
         (loss 
         = 
         'mean_squared_error' 
         , 
        
         optimizer 
         = 
         'sgd' 
         , 
        
         metrics 
         = 
         [metrics.mae, metrics.categorical_accuracy])

参数。

y_true:真实标签,theano/tensorflow张量。

y_pred:预测值, 与y_true形式相同的theano/tensorflow张量。

返回值。

单个用以代表输出各个数据点上均值的值。

可用预定义张量。

除fbeta_score额外拥有默认参数beta=1外,其他各个性能指标的参数均为y_true和y_pred 。

binary_accuracy: 对二分类问题,计算在所有预测值上的平均正确率。

categorical_accuracy:对多分类问题,计算再所有预测值上的平均正确率。

sparse_categorical_accuracy:与categorical_accuracy相同,在对稀疏的目标值预测时有用。

top_k_categorical_accracy: 计算top-k正确率,当预测值的前k个值中存在目标类别即认为预测正确。

sparse_top_k_categorical_accuracy：与top_k_categorical_accracy作用相同，但适用于稀疏情况。

定制评估函数。

定制的评估函数可以在模型编译时传入,该函数应该以(y_true, y_pred)为参数,并返回单个张量,或从metric_name映射到metric_value的字典,下面是一个示例

 
    ? 
   
         (y_true, y_pred) as arguments  
         and 
         return 
         a single tensor value. 
        
         import 
         keras.backend as K 
        
         def 
         mean_pred(y_true, y_pred): 
        
         return 
         K.mean(y_pred) 
        
         model. 
         compile 
         (optimizer 
         = 
         'rmsprop' 
         , 
        
         loss 
         = 
         'binary_crossentropy' 
         , 
        
         metrics 
         = 
         [ 
         'accuracy' 
         , mean_pred])

补充知识：Keras.metrics中的accuracy总结。

1. 背景。

Accuracy（准确率）是机器学习中最简单的一种评价模型好坏的指标，每一个从事机器学习工作的人一定都使用过这个指标。没从事过机器学习的人大都也知道这个指标，比如你去向别人推销一款自己做出来的字符识别软件，人家一定会问你准确率是多少。准确率听起来简单，但不是所有人都能理解得透彻，本文将介绍Keras中accuracy（也适用于Tensorflow）的几个新“玩法”.

2. Keras中的accuracy介绍。

Keras.metrics中总共给出了6种accuracy，如下图所示:

Keras官方中文文档:性能评估Metrices详解

接下来将对这些accuracy进行逐个介绍.

1) accuracy 。

该accuracy就是大家熟知的最朴素的accuracy。比如我们有6个样本，其真实标签y_true为[0, 1, 3, 3, 4, 2]，但被一个模型预测为了[0, 1, 3, 4, 4, 4]，即y_pred=[0, 1, 3, 4, 4, 4]，那么该模型的accuracy=4/6=66.67%.

2) binary_accuracy 。

binary_accuracy和accuracy最大的不同就是，它适用于2分类的情况。从上图中可以看到binary_accuracy的计算除了y_true和y_pred外，还有一个threshold参数，该参数默认为0.5。比如有6个样本，其y_true为[0, 0, 0, 1, 1, 0]，y_pred为[0.2, 0.3, 0.6, 0.7, 0.8, 0.1]，那么其binary_accuracy=5/6=87.5%。具体计算方法为：1）将y_pred中的每个预测值和threshold对比，大于threshold的设为1，小于等于threshold的设为0，得到y_pred_new=[0, 0, 1, 1, 1, 0]；2）将y_true和y_pred_new代入到2.1中计算得到最终的binary_accuracy=87.5%.

3) categorical_accuracy 。

categorical_accuracy和accuracy也很像。不同的是accuracy针对的是y_true和y_pred都为具体标签的情况，而categorical_accuracy针对的是y_true为onehot标签，y_pred为向量的情况。比如有4个样本，其y_true为[[0, 0, 1], [0, 1, 0], [0, 1, 0], [1, 0, 0]]，y_pred为[[0.1, 0.6, 0.3], [0.2, 0.7, 0.1], [0.3, 0.6, 0.1], [0.9, 0, 0.1]]，则其categorical_accuracy为75%。具体计算方法为：1）将y_true转为非onehot的形式，即y_true_new=[2, 1, 1, 0]；2）根据y_pred中的每个样本预测的分数得到y_pred_new=[1, 1, 1, 0]；3）将y_true_new和y_pred_new代入到2.1中计算得到最终的categorical_accuracy=75%.

4) sparse_categorical_accuracy 。

和categorical_accuracy功能一样，只是其y_true为非onehot的形式。比如有4个样本，其y_true为[2， 1， 1， 0]，y_pred为[[0.1, 0.6, 0.3], [0.2, 0.7, 0.1], [0.3, 0.6, 0.1], [0.9, 0, 0.1]]，则其categorical_accuracy为75%。具体计算方法为：1）根据y_pred中的每个样本预测的分数得到y_pred_new=[1, 1, 1, 0]；2）将y_true和y_pred_new代入到2.1中计算得到最终的categorical_accuracy=75%.

5) top_k_categorical_accuracy 。

在categorical_accuracy的基础上加上top_k。categorical_accuracy要求样本在真值类别上的预测分数是在所有类别上预测分数的最大值，才算预测对，而top_k_categorical_accuracy只要求样本在真值类别上的预测分数排在其在所有类别上的预测分数的前k名就行。比如有4个样本，其y_true为[[0, 0, 1], [0, 1, 0], [0, 1, 0], [1, 0, 0]]，y_pred为[[0.3, 0.6, 0.1], [0.5, 0.4, 0.1], [0.3, 0.6, 0.1], [0.9, 0, 0.1]]，根据前面知识我们可以计算得到其categorical_accuracy=50%，但是其top_k_categorical_accuracy是多少呢？答案跟k息息相关。如果k大于或等于3，其top_k_categorical_accuracy毫无疑问是100%，因为总共就3个类别。如果k小于3，那就要计算了，比如k=2，那么top_k_categorical_accuracy=75%。具体计算方法为：1）将y_true转为非onehot的形式，即y_true_new=[2, 1, 1, 0]；2）计算y_pred的top_k的label，比如k=2时，y_pred_new = [[0, 1], [0, 1], [0, 1], [0, 2]]；3）根据每个样本的真实标签是否在预测标签的top_k内来统计准确率，上述4个样本为例，2不在[0, 1]内，1在[0, 1]内，1在[0, 1]内，0在[0, 2]内，4个样本总共预测对了3个，因此k=2时top_k_categorical_accuracy=75%。说明一下，Keras中计算top_k_categorical_accuracy时默认的k值为5.

6) sparse_top_k_categorical_accuracy 。

和top_k_categorical_accuracy功能一样，只是其y_true为非onehot的形式。比如有4个样本，其y_true为[2， 1， 1， 0]，y_pred为[[0.3, 0.6, 0.1], [0.5, 0.4, 0.1], [0.3, 0.6, 0.1], [0.9, 0, 0.1]]。计算sparse_top_k_categorical_accuracy的步骤如下：1）计算y_pred的top_k的label，比如k=2时，y_pred_new = [[0, 1], [0, 1], [0, 1], [0, 2]]；2）根据每个样本的真实标签是否在预测标签的top_k内来统计准确率，上述4个样本为例，2不在[0, 1]内，1在[0, 1]内，1在[0, 1]内，0在[0, 2]内，4个样本总共预测对了3个，因此k=2时top_k_categorical_accuracy=75%.

3. 总结。

综上，keras中的accuracy metric用法很多，大家可以根据自己的实际情况选择合适的accuracy metric。以下是几个比较常见的用法:

1) 当你的标签和预测值都是具体的label index（如y_true=[1, 2, 1], y_pred=[0, 1, 1]）时，用keras.metrics.accuracy.

2) 当你的标签是具体的label index，而prediction是向量形式（如y_true=[1, 2, 1], y_pred=[[0.2, 0.3, 0.5], [0.9, 0.1, 0], [0, 0.4, 0.6]]）时，用keras.metrics.sparse_categorical_accuracy.

3）当你的标签是onehot形式，而prediction是向量形式（如y_true=[[0, 1, 0], [0, 0, 1], [0, 1, 0]], y_pred=[[0.2, 0.3, 0.5], [0.9, 0.1, 0], [0, 0.4, 0.6]]）时，用keras.metrics.categorical_accuracy.

当然，还有其他更高级的用法，比如对每个类别的accuracy求平均，或者对每个类别的accuracy进行加权，或者对每个样本的accuracy进行加权等，不在本文的讨论范围，大家有兴趣可以去参考Tensorflow或者Keras的官方文档.

以上这篇Keras官方中文文档:性能评估Metrices详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我.

原文链接：https://blog.csdn.net/macair123/article/details/79511215 。

最后此篇关于Keras官方中文文档:性能评估Metrices详解的文章就讲到这里了,如果你想了解更多关于Keras官方中文文档:性能评估Metrices详解的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

26

4

0

文章推荐：在keras里面实现计算f1-score的代码

文章推荐：原神游戏中元素烘炉怎么退出队伍元素烘炉离开队伍方法介绍

文章推荐：基于nexus3配置Python仓库过程详解

文章推荐： android开发基础教程—打电话发短信

keras - keras 和 tf.keras 模型之间的兼容性
我有兴趣在 tf.keras 中训练一个模型，然后用 keras 加载它。我知道这不是高度建议，但我对使用 tf.keras 来训练模型很感兴趣，因为 tf.keras 更容易构建输入管道我想利用
keras - Keras 中的自定义损失函数结合了多个输出
我进行了大量搜索，但仍然无法弄清楚如何编写具有多个交互输出的自定义损失函数。我有一个神经网络定义为: def NeuralNetwork(): inLayer = Input((2,));
keras - 差异学习率 - Keras
我正在阅读一篇名为 Differential Learning Rates 的文章在 Medium 上，想知道这是否可以应用于 Keras。我能够找到在 pytorch 中实现的这项技术。这可以在 K
keras - Keras 如何评估测试集上的损失？
我正在实现一个神经网络分类器，以打印我正在使用的这个神经网络的损失和准确性: score = model.evaluate(x_test, y_test, verbose=False) model.m
keras - keras 模型输出形状中的方括号
我最近在查看模型摘要时遇到了这个问题。我想知道，[(None, 16)] 和有什么区别？和 (None, 16) ?为什么输入层有这样的输入形状？来源:model.summary() can't
keras - Keras 中基于输入数据的自定义损失函数
我正在尝试使用 Keras 创建自定义损失函数。我想根据输入计算损失函数并预测神经网络的输出。我尝试在 Keras 中使用 customloss 函数。我认为 y_true 是我们为训练提供的输出，
keras - keras 中二维元素的填充序列
我有一组样本，每个样本都是一组属性的序列(例如，一个样本可以包含 10 个序列，每个序列具有 5 个属性)。属性的数量总是固定的，但序列的数量(时间戳)可能因样本而异。我想使用这个样本集在 Keras
keras - Keras 中的类数量错误
Keras 在训练集和测试集文件夹中发现了错误数量的类。我有 3 节课，但它一直说有 4 节课。有人可以帮我吗？这里的代码: cnn = Sequential() cnn.add(Conv2D(32
keras - keras 自定义层中的持久变量
我想编写一个自定义层，在其中我可以在两次运行之间将变量保存在内存中。例如， class MyLayer(Layer): def __init__(self, out_dim = 51, **kwarg
keras - Keras:如何将学习率输出到张量板上
我添加了一个回调来降低学习速度： keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=100,
keras - keras lstm层中的多个内核是什么意思？
在 https://keras.io/layers/recurrent/我看到 LSTM 层有一个 kernel和一个 recurrent_kernel .它们的含义是什么？根据我的理解，我们需要 L
keras - 如何检查安装了哪个版本的 Keras？
问题与标题相同。我不想打开 Python，而是使用 MacOS 或 Ubuntu。最佳答案 Python 库作者将版本号放入 .__version__ 。您可以通过在命令行上运行以下命令来打印它:
keras - Keras 中的嵌入是什么？
Keras 文档并不清楚这实际上是什么。我知道我们可以用它来将输入特征空间压缩成更小的空间。但从神经设计的角度来看，这是如何完成的呢？它是一个自动编码器，RBM吗？最佳答案据我所知，嵌入层是一个简
keras - Keras 的中心损失
我想实现[http://ydwen.github.io/papers/WenECCV16.pdf]中解释的中心损失]在喀拉斯我开始创建一个具有 2 个输出的网络，例如: inputs = Input
keras - keras 中的多对一实现
我正在尝试实现多对一模型，其中输入是大小为的词向量d .我需要输出一个大小为的向量d 在 LSTM 结束时。在此 question ，提到使用(对于多对一模型) model = Sequenti
keras - Keras 中验证集的不同损失函数
我有不平衡的训练数据集，这就是我构建自定义加权分类交叉熵损失函数的原因。但问题是我的验证集是平衡的，我想使用常规的分类交叉熵损失。那么我可以在 Keras 中为验证集传递不同的损失函数吗？我的意思是用
keras - Keras 中输入数据的规范化
DL 中的一项常见任务是将输入样本归一化为零均值和单位方差。可以使用如下代码“手动”执行规范化: mean = np.mean(X, axis = 0) std = np.std(X, axis =
keras - Keras 中回调和进度条的准确性不匹配
我正在尝试学习 Keras 并使用 LSTM 解决分类问题。我希望能够绘制准确率和损失，并在训练期间更新图。为此，我正在使用 callback function . 由于某种原因，我在回调中收到的准
keras - 嵌入 Keras
在 Keras 内置函数中嵌入使用哪种算法？Word2vec？手套？其他？ https://keras.io/layers/embeddings/ 最佳答案简短的回答是都不是。本质上，GloVe 的
keras - keras 中的渐变裁剪
我有一个使用 Keras 完全实现的 LSTM RNN，我想使用梯度剪裁，梯度范数限制为 5(我正在尝试复制一篇研究论文)。在实现神经网络方面，我是一个初学者，我将如何实现？是否只是(我正在使用 r

首页

博学

6Ren·AI

商城

Keras官方中文文档:性能评估Metrices详解