- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我制作了我的 Django 模型,在将测试/虚拟记录插入到我的 PostgreSQL 数据库后,我意识到我的数据对于每条记录来说都非常大。所有字段中的数据总和约为每条记录 700 KB。我估计我将拥有大约 500 万条记录,因此这将在 3350 GB 左右变得非常大。我的大部分数据都是大型 JSON 转储(每个字段大约 70+ KB)。
我不确定在通过 Django 框架处理时 PostgreSQL 是否会自动压缩我的数据。我想知道在将数据输入数据库之前是否应该压缩数据。
问题:当使用 Django 模型字段类型 TextField
时,PostgreSQL 会使用一些 x
压缩算法自动压缩我的字符串字段吗?
我不应该依赖 PostgreSQL 而只是预先压缩我的数据然后将其输入数据库吗?如果是这样,我应该使用哪个压缩库?我已经在 Python 中尝试过 zlib
并且看起来很棒,但是,我读到还有 gzip
库,我很困惑哪个是最有效的(就术语而言压缩和解压缩速度以及压缩百分比)。
编辑:我正在阅读 this Django snippet for CompressedTextField这让我对使用哪个压缩库感到困惑。我看到一些人使用 zlib
而一些人使用 gzip
。
编辑 2:This stackoverflow question表示 PostgreSQL 会自动压缩字符串数据。
编辑 3:PostgreSQL 使用 pg_lzcompress.c 进行压缩,它是 LZ 压缩系列的一部分。是否可以安全地假设我们不需要在 TextField
本身上使用某种其他形式的压缩(zlib
或 gzip
),因为它数据库本身的数据类型是 text
(可变长度字符串)吗?
最佳答案
是的,postgresql 将压缩大文本字段,完全独立于您使用它的任何框架。
大字段值使用称为 TOAST 的东西存储.此类属性可能会被压缩,如果太大而无法直接放入列中,它们将被存储在称为 TOAST 表的特殊文件中。
正如您已经确定的那样,使用了 LZ 压缩。这不会提供与某些其他算法一样高的压缩率。但是,如果磁盘空间是您的主要关注点,那么为了您可能获得的 yield ,我怀疑在将数据发送到数据库之前压缩应用程序中的数据是否值得。
您可以通过设置列的存储模式来影响属性的存储。请参阅 ALTER TABLE 手册页上的 SET STORAGE .
PLAIN must be used for fixed-length values such as integer and is inline, uncompressed. MAIN is for inline, compressible data. EXTERNAL is for external, uncompressed data, and EXTENDED is for external, compressed data. EXTENDED is the default for most data types that support non-PLAIN storage.
TEXT 的默认值是 EXTENDED。
不过,您应该考虑一下您的数据将如何使用。将使用什么类型的查询来访问数据?将使用什么过滤条件?它必须通读所有这些大型 TOAST 属性以访问 WHERE 子句中使用的值,然后性能可能很差。
关于python - Django:数据库级别或代码级别的TextField(字符串)数据压缩,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24578984/
我尝试理解[c代码 -> 汇编]代码 void node::Check( data & _data1, vector& _data2) { -> push ebp -> mov ebp,esp ->
我需要在当前表单(代码)的上下文中运行文本文件中的代码。其中一项要求是让代码创建新控件并将其添加到当前窗体。 例如,在Form1.cs中: using System.Windows.Forms; ..
我有此 C++ 代码并将其转换为 C# (.net Framework 4) 代码。有没有人给我一些关于 malloc、free 和 sprintf 方法的提示? int monate = ee; d
我的网络服务器代码有问题 #include #include #include #include #include #include #include int
给定以下 html 代码,将列表中的第三个元素(即“美丽”一词)以斜体显示的 CSS 代码是什么?当然,我可以给这个元素一个 id 或一个 class,但 html 代码必须保持不变。谢谢
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
我试图制作一个宏来避免重复代码和注释。 我试过这个: #define GrowOnPage(any Page, any Component) Component.Width := Page.Surfa
我正在尝试将我的旧 C++ 代码“翻译”成头条新闻所暗示的 C# 代码。问题是我是 C# 中的新手,并不是所有的东西都像 C++ 中那样。在 C++ 中这些解决方案运行良好,但在 C# 中只是不能。我
在 Windows 10 上工作,R 语言的格式化程序似乎没有在 Visual Studio Code 中完成它的工作。我试过R support for Visual Studio Code和 R-T
我正在处理一些报告(计数),我必须获取不同参数的计数。非常简单但乏味。 一个参数的示例查询: qCountsEmployee = ( "select count(*) from %s wher
最近几天我尝试从 d00m 调试网络错误。我开始用尽想法/线索,我希望其他 SO 用户拥有可能有用的宝贵经验。我希望能够提供所有相关信息,但我个人无法控制服务器环境。 整个事情始于用户注意到我们应用程
我有一个 app.js 文件,其中包含如下 dojo amd 模式代码: require(["dojo/dom", ..], function(dom){ dom.byId('someId').i
我对“-gencode”语句中的“code=sm_X”选项有点困惑。 一个例子:NVCC 编译器选项有什么作用 -gencode arch=compute_13,code=sm_13 嵌入库中? 只有
我为我的表格使用 X-editable 框架。 但是我有一些问题。 $(document).ready(function() { $('.access').editable({
我一直在通过本教程学习 flask/python http://blog.miguelgrinberg.com/post/the-flask-mega-tutorial-part-i-hello-wo
我想将 Vim 和 EMACS 用于 CNC、G 代码和 M 代码。 Vim 或 EMACS 是否有任何语法或模式来处理这种类型的代码? 最佳答案 一些快速搜索使我找到了 this vim 和 thi
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve this
这个问题在这里已经有了答案: Enabling markdown highlighting in Vim (5 个回答) 6年前关闭。 当我在 Vim 中编辑包含 Markdown 代码的 READM
我正在 Swift3 iOS 中开发视频应用程序。基本上我必须将视频 Assets 和音频与淡入淡出效果合并为一个并将其保存到 iPhone 画廊。为此,我使用以下方法: private func d
pipeline { agent any stages { stage('Build') { steps { e
我是一名优秀的程序员,十分优秀!