machine-learning - scipy.optimize.minimize 如何取损失函数的导数？-6ren

machine-learning - scipy.optimize.minimize 如何取损失函数的导数？

转载作者：行者123 更新时间：2023-12-05 05:01:55

29

4

我正在尝试弄清楚 scipy.optimize.minimize 在机器学习中的工作原理。到目前为止，我了解到您向它传递了一个损失函数，以便它可以找到使您损失最低的参数值。但据我所知，它首先必须找到损失函数的梯度/Hessian，然后才能找到最小值。它是如何做到的？它如何知道如何获取 python 函数的导数，其中包含其他函数调用和算法？它如何将其推导为数学函数，它可以取导数？在我的例子中，我传递给 minimize 的损失函数执行以下操作:首先，它解决了一个流行病学模型 (SEIRD)，该模型旨在预测 COVID-19 的确诊病例和死亡病例。然后它将模型结果与实际数据进行比较，并找到它返回的 MSLE。代码如下所示:

def model_decay(params, data, population, return_solution=False, full_validation=True, forecast_days=0):
R_0, theta, k, L, R_t, D_rec, D_inc = params # R_0, fatality rate, k form, L shape, R end
N = population # Population of each country

n_infected = data['ConfirmedCases'].iloc[0] 
n_dead = data['Fatalities'].iloc[0]
max_days = len(data) + forecast_days 
rho = 1.0 / D_rec
alpha = 1.0 / D_inc    
beta = R_0 * rho  

y0 = N - n_infected, 0, n_infected, 0 ,0  

def beta(t):
    return ((R_0-R_t) / (1 + (t/L)**k)+R_t) * rho

t= np.arange(max_days)

# Solve the SEIR differential equation.
sol = solve_ivp(seir_d, [0, max_days],y0,  args=(N, beta, rho, alpha, theta),t_eval=t)
sus, exp, inf, rec, dead = sol.y    

#model_decay.counter +=1
#print(model_decay.counter)

# Predict confirmedcases
y_pred_cases = np.clip((inf + rec+dead),0,np.inf) 
y_true_cases = data['ConfirmedCases'].values

# Predict fatalities
y_pred_dead = np.clip((dead),0,np.inf) 
y_true_dead = data['Fatalities'].values    

#Thanks to anjum-48 for the following lines of code in this function.

optim_days = min(20, len(data))  # Days to optimise for finds the lowest num. 

weights = 1 / np.arange(1, optim_days+1)[::-1]  # Recent data is more heavily weighted
# using mean squre log error to evaluate
msle_conf = mean_squared_log_error(y_true_cases[-optim_days:], y_pred_cases[-optim_days:],weights)
msle_dead = mean_squared_log_error(y_true_dead[-optim_days:], y_pred_dead[-optim_days:],weights)
if full_validation == True :
    msle = np.mean([msle_conf,msle_dead])
else : 
    msle = msle_conf

if return_solution:
    return msle, sol
else:
    return msle

最小化调用如下所示:

model_decay_res = minimize(model_decay, [1.8, 0.04, 2, 20, 1 ,15, 4.9], 
                bounds=((0, 6.49), (0.01, 0.15), (0, 5), (0, 200),(0,6.49),(3.48,18),(4.9,5.9)),
                args=(train_data, population, False,full_validation),
                method='L-BFGS-B')

它最终给了我一个非常低的 MSLE，所以它工作得很好，我只是不明白到底是怎么回事。

最佳答案

But as far as i understand, it first has to find the gradient/Hessian of the loss function before it can find the minima. How does it do that?

这取决于您为其提供的参数以及您在 python 环境中使用的 SciPy 版本。最后我检查了一些支持的渐变方法。 1.4.1 版本的文档在这里: https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.minimize.html

显示

jac{callable, ‘2-point’, ‘3-point’, ‘cs’, bool}, optional

并描述哪些最小化器支持哪些。您可以使用有限差分方案“2 点”，这是许多人的默认方案。

callable 意味着您提供了一个实现了__call__ 属性的函数或对象(独立函数默认有这个，对象没有)。如果你知道你已经分析计算并在 python 中实现的雅可比或梯度 b/c(或通过低级可调用的 C/C++:https://docs.scipy.org/doc/scipy-1.4.0/reference/generated/scipy.LowLevelCallable.html?highlight=lowlevelcallable#scipy.LowLevelCallable)，你通常会使用它

cs 选项非常酷，是我第一次开始使用 SciPy 时学到的。基本上，你在目标函数中的所有操作都传递了一个非常小的复杂值的复杂参数(例如 0.0001)，然后采用结果的复杂部分可以很好地估计梯度(优于有限差分)。

bool 值更多地是关于表示是稀疏还是密集，并且并非在所有优化器例程中都使用。

我应该澄清的一件事是 minimize 例程只是转发到实际处理优化的相关优化器方法(例如“trust-constr”、“slsqp”等)。特别适用于 Hessians。

希望这可以帮助您了解 minimize 例程“幕后”发生的事情。

How does it know how to take the derivatives of a python function, which contains other function calls and algorithms inside it?

在您提供的情况下，我认为它只是调用函数，没有什么特别的。

此外，作为旁注(不是您的 2 个问题中的任何一个)，如果您想跟踪优化器的进度，您可以传递 disp=True 或 disp=1随着优化器的进展，这应该会向您显示一些高级跟踪输出。

关于machine-learning - scipy.optimize.minimize 如何取损失函数的导数？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62451446/

29

4

0

文章推荐： python - 如何在 f 字符串中解释命名表达式？

文章推荐： c# - .net core Startup.cs CreateScope 或 BuildServiceProvider

文章推荐： python-3.x - xlwings 使用源格式复制和粘贴

文章推荐： python - model.predict 导致 oom 问题，但 model.fit 不会 :

详解C语言sscanf()函数、vsscanf()函数、vscanf()函数
C语言sscanf()函数：从字符串中读取指定格式的数据头文件： ?
php - 如何解释at()函数； substr()函数;伪代码中的exist()函数
最近，我有一个关于工作预评估的问题，即使查询了每个功能的工作原理，我也不知道如何解决。这是一个伪代码。下面是一个名为foo()的函数，该函数将被传递一个值并返回一个值。如果将以下值传递给foo函数，
VBS教程：函数-CStr 函数
CStr 函数返回表达式，该表达式已被转换为 String 子类型的 Variant。 CStr(expression) expression 参数是任意有效的表达式。说明通常，可以
VBS教程：函数-CSng 函数
CSng 函数返回表达式，该表达式已被转换为 Single 子类型的 Variant。 CSng(expression) expression 参数是任意有效的表达式。说明通常，可
VBS教程：函数-CreateObject 函数
CreateObject 函数创建并返回对 Automation 对象的引用。 CreateObject(servername.typename [, location]) 参数 serv
VBS教程：函数-Cos 函数
Cos 函数返回某个角的余弦值。 Cos(number) number 参数可以是任何将某个角表示为弧度的有效数值表达式。说明 Cos 函数取某个角并返回直角三角形两边的比值。此比值是
VBS教程：函数-CLng 函数
CLng 函数返回表达式，此表达式已被转换为 Long 子类型的 Variant。 CLng(expression) expression 参数是任意有效的表达式。说明通常，您可以使
VBS教程：函数-CInt 函数
CInt 函数返回表达式，此表达式已被转换为 Integer 子类型的 Variant。 CInt(expression) expression 参数是任意有效的表达式。说明通常，可
VBS教程：函数-Chr 函数
Chr 函数返回与指定的 ANSI 字符代码相对应的字符。 Chr(charcode) charcode 参数是可以标识字符的数字。说明从 0 到 31 的数字表示标准的不可打印的
VBS教程：函数-CDbl 函数
CDbl 函数返回表达式，此表达式已被转换为 Double 子类型的 Variant。 CDbl(expression) expression 参数是任意有效的表达式。说明通常，您可
VBS教程：函数-CDate 函数
CDate 函数返回表达式，此表达式已被转换为 Date 子类型的 Variant。 CDate(date) date 参数是任意有效的日期表达式。说明 IsDate 函数用于判断 d
VBS教程：函数-CCur 函数
CCur 函数返回表达式，此表达式已被转换为 Currency 子类型的 Variant。 CCur(expression) expression 参数是任意有效的表达式。说明通常，
VBS教程：函数-CByte 函数
CByte 函数返回表达式，此表达式已被转换为 Byte 子类型的 Variant。 CByte(expression) expression 参数是任意有效的表达式。说明通常，可以
VBS教程：函数-CBool 函数
CBool 函数返回表达式，此表达式已转换为 Boolean 子类型的 Variant。 CBool(expression) expression 是任意有效的表达式。说明如果 ex
VBS教程：函数-Atn 函数
Atn 函数返回数值的反正切值。 Atn(number) number 参数可以是任意有效的数值表达式。说明 Atn 函数计算直角三角形两个边的比值 (number) 并返回对应角的弧
VBS教程：函数-Asc 函数
Asc 函数返回与字符串的第一个字母对应的 ANSI 字符代码。 Asc(string) string 参数是任意有效的字符串表达式。如果 string 参数未包含字符，则将发生运行时错误。
VBS教程：函数-Array 函数
Array 函数返回包含数组的 Variant。 Array(arglist) arglist 参数是赋给包含在 Variant 中的数组元素的值的列表（用逗号分隔）。如果没有指定此参数，则
VBS教程：函数-Abs 函数
Abs 函数返回数字的绝对值。 Abs(number) number 参数可以是任意有效的数值表达式。如果 number 包含 Null，则返回 Null；如果是未初始化变量，则返回 0。
VBS教程：函数-FormatPercent 函数
FormatPercent 函数返回表达式，此表达式已被格式化为尾随有 % 符号的百分比（乘以 100 ）。 FormatPercent(expression[,NumDigitsAfterD
VBS教程：函数-FormatNumber 函数
FormatNumber 函数返回表达式，此表达式已被格式化为数值。 FormatNumber( expression [,NumDigitsAfterDecimal [,Inc

首页

博学

6Ren·AI

商城

machine-learning - scipy.optimize.minimize 如何取损失函数的导数？