python - 可以修剪 statsmodels 结果进行序列化吗？-6ren

python - 可以修剪 statsmodels 结果进行序列化吗？

转载作者：行者123 更新时间：2023-11-30 22:28:38

24

4

我正在尝试构建一个分布式按需建模生产系统，并希望在内存中保留数十万个小模型(并将它们传输到数据库以及在进程之间传输)。我正在查看 statsmodels。

我最感兴趣的只是能够保存模型的系数并调用模型的预测。

看起来 statsmodels 包含大量附加信息(O(原始数据大小))，而这些信息对于该用例来说是不需要的。序列化的大小有几兆字节，而系数的大小只有几个字节。这会填满我的数据库并降低分布式处理和缓存性能，其中大量时间花在简单的序列化和反序列化上。通过在内存中保留两个数量级的模型，删除非系数数据可能会导致两个数量级的加速。

在statsmodels中，有没有通用的方法:

我可以要求不生成非输出系数数据，或者
从对象中删除它，或者
提取系数(这很容易)以及使用它们进行预测的方法(这似乎不太容易)

我正在使用各种 statsmodels 模型，但主要是 GLM 和 Logit。

我看起来并不平凡。结果对象引用模型对象，模型对象引用原始数据。我无法使其适用于单个模型，但是(通过一一删除字段)。但是否有适用于所有模型的通用方法？

最佳答案

Statsmodels 在结果类中有一个 remove_data 方法，正是为此目的而添加的。首先，大多数结果都是延迟计算的，因此在调用fit之后，返回的结果实例还不包含很多结果统计信息。但是，它保留对模型和基础数据的引用，以根据需要计算这些结果统计数据。例如，调用 results.summary() 需要计算其中的许多或大部分。

如果我们不需要计算这些统计数据，因为我们已经拥有了所有想要的统计数据，或者我们只想进行预测，那么我们可以删除所有大型数组和数据以减少内存需求。这是通过调用 results.remove_data() 来完成的。

http://www.statsmodels.org/devel/generated/statsmodels.discrete.discrete_model.LogitResults.remove_data.html

https://github.com/statsmodels/statsmodels/issues/1729

请注意，模型和结果类维护一个应删除内容的白名单。在某些情况下，白名单可能不完整。 (在这种情况下，我们将不胜感激错误报告。)

需要注意的是，帕西的配方不能被腌制。因此，无论是否使用 remove_data 进行酸洗，当前都需要在使用公式时重新创建公式，如果环境不包含所需信息，这可能不起作用。如果 patsy 用于转换新数据以进行预测，则这是相关的。如果不使用公式则无关紧要。

问题的最后一部分:目前没有独立的预测函数。预测方法被硬编码在模型内部，或 GLM 中的链接函数。因此，目前无法在不创建模型实例的情况下进行预测。 (在最简单的情况下，例如仅使用 numpy 数组，它甚至不需要是具有完整数据集的模型。)

关于python - 可以修剪 statsmodels 结果进行序列化吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46577285/

24

4

0

文章推荐： python - 从带有索引的多列中选择最大值

文章推荐： python - 转换为 numpy 数组的元组列表

文章推荐： mysql - select中的const子查询执行了多少次？

文章推荐： c# - 部署后 asp.net mvc 3 web 应用程序不工作

powershell 修剪 - 删除字符串后的所有字符
在字符串 (\test.something) 之后删除所有内容的命令是什么。我在文本文件中有信息，但是在字符串之后有 1000 行我不想要的文本。如何删除包括字符串在内的所有内容。这就是我所拥有的
jquery - 删除每个元素上的空白 - 修剪
我想删除每个项目的空白.amount 我在 .amount 类上使用 trim 和 each，但它似乎不起作用: jQuery('.amount').each(function(){ jQue
Python 修剪/过滤掉点
我列出了以下正在稳步增加的点，例如: [[0, 0], [9, 4], [18, 19], [25, 34], [48, 48], [54, 53], [61, 65], [69, 82], [73,
jQuery - 修剪()文档中所有元素的优雅方式？
清理自动生成的 html 带来更多乐趣。标签中注入(inject)了大量无关的空格: Lorem Ipsum dolor sit... ( 代表实际空间，而不是实
python - 修剪/缩尾标准差
计算 trimmed 的有效方法是什么？或winsorized列表的标准差？我不介意使用numpy，但如果我必须制作列表的单独副本，它会非常慢。最佳答案这将制作两个副本，但您应该尝试一下，因为它
c# - 修剪 float
这个问题在这里已经有了答案: 关闭10 年前。 Possible Duplicate: Leave only two decimal places after the dot Formatting
c# - 强制文本长度 + 修剪
我正在使用绑定(bind)来填充 Listbox，其中包含 TextBlock 等。问题是: 如何确保绑定(bind)到 TextBlock 的 Text 属性的文本具有特定长度，或者它是显示为某些
ios - 修剪 NSString
我正在按以下方式修剪 NSString: NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:
MySQL:修剪 *both* 空格和换行符
我有一个文本列，其内容在字符串的前后混合了换行符和空白字符。我正在尝试编写一个 SELECT 语句，它向我显示没有前导和尾随垃圾的内容。以下查询修剪空格: SELECT TRIM(column) F
python - 修剪/截断时我是否遗漏了什么？
这个问题在这里已经有了答案: How to slice a pandas DataFrame by position? (5 个答案) 关闭 5 年前。我似乎看不出这里有什么问题。我有一个长度为
MySQL 修剪 WHERE 中的值
我没有找到类似的问题可能是因为我没有找到正确的词(英语不是我的母语) 问题我有一个 varchar 值，末尾有一个空格:"opt-193-381-markets " 当我执行 SELECT 的值没有
PHP 修剪()问题
假设我有 $url="../folder/file"，我想找到并删除 ../ 部分。我正在使用 trim() ...... $url = trim($url,"../"); ……但它给了我一个警告:
JAVA 修剪()不工作
这个问题在这里已经有了答案: Java String trim has no effect (7 个答案) string trim function is not working [closed]
PHP 从字符串中提取文本 - 修剪？
我有以下 XML: tag:search.twitter.com,2005:22204349686 如何将第二个冒号后的所有内容写入变量？例如22204349686 最佳答案 if(preg_mat
c++ - 修剪:什么时候停止？
修剪在深度优先搜索中什么时候停止有效？我一直在研究一种有效的方法来解决 N-Queens 问题，并且我第一次关注修剪。我已经为前两行实现了它，但它什么时候停止有效？我应该修剪多远？最佳答案 N 皇后
r - 修剪 ggplot2 中的第一个和最后一个标签
我有一个图表，按天将两种类型的数据制成表格，我希望只修剪图表中的第一个和最后一个标签。这是一个可重现的数据示例: library(dplyr) library(ggplot2) library(sca
excel - 修剪 Excel 单元格中的前导空格
如何去掉 excel 中的前导空格? 我有很多行有这个问题。最佳答案在您的空格删除请求中，请注意: TRIM仅删除字符 32，即标准空格。 CLEAN将删除非打印空格，例如回车符(字符 13)和换
angularjs - 禁用指令属性的 Angular 修剪
当前正在编写指令，并且需要将空格作为字符传递给它。喜欢: 结果证明 angular 消除了前导空间；但我想保留它。有什么办法吗？编辑:我将指令参数作为字符串传递(使用@，而不是作为变量，使用=
delphi - 修剪 BOLD_CLOCKLOG 表
我正在为一个使用 Bold for Delphi 对象持久性框架的应用程序的数据库做一些维护。该数据库已经投入生产多年，其中一些表已经变得非常大。其中之一是 BOLD_CLOCKLOG这与 Bold
cocoa - “修剪”一个 NSString
如何“修剪” NSString 以便仅用旧字符串的特定部分创建新字符串？例如，我有字符串“Monday the 12th of September”，我如何仅选出“Monday”部分？最佳答案使

首页

博学

6Ren·AI

商城

python - 可以修剪 statsmodels 结果进行序列化吗？