gpt4 book ai didi

python - Python类中返回方法调用结果的常见方法是什么?

转载 作者:太空宇宙 更新时间:2023-11-03 17:11:45 28 4
gpt4 key购买 nike

我有一个 Python 类,它为给定数据训练模型:

class Model(object):
def __init__(self, data):
self.data = data
self.result = None

def train(self):
... some codes for training the model ...
self.result = ...

创建模型对象后,

myModel = Model(myData)

模型未经训练。然后我可以调用 train 方法来启动训练:

myModel.train()

然后 myModel.result 将就地更新。

此外,我可以将 train 方法重写为:

def train(self):
... some code for training the model ...
result = ...
# avoid update in-place
trainedModel = copy.copy(self)
trainedModel.result = result
return trainedModel

这样,通过调用myTrainedModel = myModel.train(),我就有了一个新对象,并且原始myModel的状态没有改变。

我的问题是:哪种更常见的方式来存储类中方法的返回结果?

最佳答案

My question is: Which is a more common way to store the returned result from a method in a class?

这里真的很难说。您的示例将其范围缩小到一个非常具体的用例,即使它更广泛,也可能无法找到完全没有主观性的答案。

尽管如此,我也许可以提供一些信息来帮助您指导您的决策。

纯函数

纯函数是不会触发副作用的函数。它们不会修改函数之外的任何状态。它们通常被认为是最容易正确使用的函数类型,因为副作用是开发中的常见触发点(“该系统的哪个部分导致此状态变为此状态?”) 零副作用的函数几乎不会出错。

你的第二个版本是一个纯函数。它没有副作用:它返回一个新训练的模型。它不会影响任何已经存在的东西。

纯函数本质上也是线程安全的。由于它们不修改共享状态,因此它们对并发范例非常友好。

副作用

尽管如此,在许多程序中,触发副作用的函数通常是实际需要的。从单线程效率的角度来看,任何面临修改复杂状态或返回全新状态之间选择的函数都可能因执行后者而受到严重瓶颈。

想象一下,作为一个总体情况,一个函数在图像上绘制一个像素,返回一个完整的新图像,其中绘制了一个像素,而不是修改您传入的图像。这往往会立即成为一个重大瓶颈。另一方面,如果我们返回的结果并不复杂(例如:只是一个整数或非常简单的聚合),通常纯函数会更快。

因此,在某些情况下,当结果复杂且创建成本高昂时,触发副作用(理想情况下只有一个逻辑副作用,以避免成为令人困惑的错误来源)的函数通常是实际需要的。

纯净或“不纯净”

因此,这里的选择可以归结为纯函数或具有副作用的“不纯”函数。由于我们正在处理面向对象的场景,因此看待此问题的另一种方式是可变性与不变性(这通常与纯函数和“不纯”函数具有类似的差异)。我们可以训练模型或创建并返回经过训练的模型,而无需触及现有模型。

选择哪个可能“更好”取决于您的追求。如果安全性和可维护性是您的目标,那么纯净版本可能会有所帮助。如果创建和返回新模型的成本很高,而效率是您的主要目标,那么训练现有模型可能会帮助您避免瓶颈。

如果有疑问,我一般会建议纯净版本。在担心性能之前,通常会首先考虑提高生产力的安全性和可维护性等质量。稍后,您可以使用分析器并深入了解您的热点,如果您发现返回全新的经过训练的模型是一个瓶颈,那么您可以添加一种新方法来就地训练模型,并将其用于最关键的情况代码路径。

关于python - Python类中返回方法调用结果的常见方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34007777/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com