gpt4 book ai didi

machine-learning - pyspark中的对数损失函数

转载 作者:行者123 更新时间:2023-11-30 08:28:31 25 4
gpt4 key购买 nike

pyspark中有内置的日志丢失函数吗?

我有一个包含列的 pyspark 数据框:概率、原始预测、标签

我想使用平均对数损失来评估这些预测。

最佳答案

据我所知,没有直接存在这样的函数。但是,给定一个 PySpark 数据帧 df ,其列的名称如问题中所示,可以显式计算平均对数损失:

import pyspark.sql.functions as f

df = (
df.withColumn(
'logloss'
, -f.col('label')*f.log(f.col('probability')) - (1.-f.col('label'))*f.log(1.-f.col('probability'))
)
)

logloss = df.agg(f.mean('logloss').alias('ll')).collect()[0]['ll']

我在这里假设label是数字(即0或1),并且概率代表模型的预测。 (不确定 rawPrediction 可能意味着什么。)

关于machine-learning - pyspark中的对数损失函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49020400/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com