- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我制作了我的 Django 模型,在将测试/虚拟记录插入到我的 PostgreSQL 数据库后,我意识到我的数据对于每条记录来说都非常大。所有字段中的数据总和约为每条记录 700 KB。我估计我将拥有大约 500 万条记录,因此这将在 3350 GB 左右变得非常大。我的大部分数据都是大型 JSON 转储(每个字段大约 70+ KB)。
我不确定在通过 Django 框架处理时 PostgreSQL 是否会自动压缩我的数据。我想知道在将数据输入数据库之前是否应该压缩数据。
问题:当使用 Django 模型字段类型 TextField
时,PostgreSQL 会使用一些 x
压缩算法自动压缩我的字符串字段吗?
我不应该依赖 PostgreSQL 而只是预先压缩我的数据然后将其输入数据库吗?如果是这样,我应该使用哪个压缩库?我已经在 Python 中尝试过 zlib
并且看起来很棒,但是,我读到还有 gzip
库,我很困惑哪个是最有效的(就术语而言压缩和解压缩速度以及压缩百分比)。
编辑:我正在阅读 this Django snippet for CompressedTextField这让我对使用哪个压缩库感到困惑。我看到一些人使用 zlib
而一些人使用 gzip
。
编辑 2:This stackoverflow question表示 PostgreSQL 会自动压缩字符串数据。
编辑 3:PostgreSQL 使用 pg_lzcompress.c 进行压缩,它是 LZ 压缩系列的一部分。是否可以安全地假设我们不需要在 TextField
本身上使用某种其他形式的压缩(zlib
或 gzip
),因为它数据库本身的数据类型是 text
(可变长度字符串)吗?
最佳答案
是的,postgresql 将压缩大文本字段,完全独立于您使用它的任何框架。
大字段值使用称为 TOAST 的东西存储.此类属性可能会被压缩,如果太大而无法直接放入列中,它们将被存储在称为 TOAST 表的特殊文件中。
正如您已经确定的那样,使用了 LZ 压缩。这不会提供与某些其他算法一样高的压缩率。但是,如果磁盘空间是您的主要关注点,那么为了您可能获得的 yield ,我怀疑在将数据发送到数据库之前压缩应用程序中的数据是否值得。
您可以通过设置列的存储模式来影响属性的存储。请参阅 ALTER TABLE 手册页上的 SET STORAGE .
PLAIN must be used for fixed-length values such as integer and is inline, uncompressed. MAIN is for inline, compressible data. EXTERNAL is for external, uncompressed data, and EXTENDED is for external, compressed data. EXTENDED is the default for most data types that support non-PLAIN storage.
TEXT 的默认值是 EXTENDED。
不过,您应该考虑一下您的数据将如何使用。将使用什么类型的查询来访问数据?将使用什么过滤条件?它必须通读所有这些大型 TOAST 属性以访问 WHERE 子句中使用的值,然后性能可能很差。
关于python - Django:数据库级别或代码级别的TextField(字符串)数据压缩,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24578984/
我的问题是如何在 python 中创建一个简单的数据库。我的例子是: User = { 'Name' : {'Firstname', 'Lastname'}, 'Address' : {'Street
我需要创建一个与远程数据库链接的应用程序! mysql 是最好的解决方案吗? Sqlite 是唯一的本地解决方案吗? 我使用下面的方法,我想知道它是否是最好的方法! NSString *evento
给定两台 MySQL 服务器,一台本地,一台远程。两者都有一个包含表 bohica 的数据库 foobar。本地服务器定义了用户 'myadmin'@'%' 和 'myadmin'@'localhos
我有以下灵活的搜索查询 Select {vt:code},{vt:productcode},{vw:code},{vw:productcode} from {abcd AS vt JOIN wxyz
好吧,我的电脑开始运行有点缓慢,所以我重置了 Windows,保留了我的文件。因为我的大脑还没有打开,所以我忘记事先备份我的 MySQL 数据库。我仍然拥有所有原始文件,因此我实际上仍然拥有数据库,但
如何将我的 Access 数据库 (.accdb) 转换为 SQLite 数据库 (.sqlite)? 请,任何帮助将不胜感激。 最佳答案 1)如果要转换 db 的结构,则应使用任何 DB 建模工具:
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
我想在相同的 phonegap 应用程序中使用 android 数据库。 更多说明: 我创建了 phonegap 应用程序,但 phonegap 应用程序不支持服务,所以我们已经在 java 中为 a
Time Tracker function clock() { var mytime = new Date(); var seconds
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。 在我的 Controller 中,我(从 ajax 请求)传递了一个时间戳,并且我需要显示之前的 8 个事件。因此,如果时间戳是(转换后)
我有一个可以收集和显示各种测量值的产品(不会详细介绍)。正如人们所期望的那样,显示部分是一个数据库+建立在其之上的网站(使用 Symfony)。 但是,我们可能还会创建一个 API 来向第三方公开数据
我们将 SQL Server 从 Azure VM 迁移到 Azure SQL 数据库。 Azure VM 为 DS2_V2、2 核、7GB RAM、最大 6400 IOPS Azure SQL 数据
我正在开发一个使用 MongoDB 数据库的程序,但我想问在通过 Java 执行 SQL 时是否可以使用内部数据库进行测试,例如 H2? 最佳答案 你可以尝试使用Testcontainers Test
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 已关闭 9 年前。 此问题似乎与 a specific programming problem, a sof
我正在尝试使用 MSI 身份验证(无需用户名和密码)从 Azure 机器学习服务连接 Azure SQL 数据库。 我正在尝试在 Azure 机器学习服务上建立机器学习模型,目的是我需要数据,这就是我
我在我的 MySQL 数据库中使用这个查询来查找 my_column 不为空的所有行: SELECT * FROM my_table WHERE my_column != ""; 不幸的是,许多行在
我有那个基地:http://sqlfiddle.com/#!2/e5a24/2这是 WordPress 默认模式的简写。我已经删除了该示例不需要的字段。 如您所见,我的结果是“类别 1”的两倍。我喜欢
我有一张这样的 table : mysql> select * from users; +--------+----------+------------+-----------+ | userid
我有表: CREATE TABLE IF NOT EXISTS `category` ( `id` int(11) NOT NULL, `name` varchar(255) NOT NULL
我是一名优秀的程序员,十分优秀!