- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想将大量数据存储在关系数据库中(在我的例子中是 RDS 上的 postgresql),但我不确定要使用什么结构。我参加了包括数据库规范化在内的数据库类(class),但我仍然不确定如何构建数据库。
我的数据由气候模型的表格结果组成,按区域(流域)汇总。
中的参数[温度、降水..等]
length = 11[1960 : 2014]
中的年份[1:12]
月份区域(盆地)[1 : 16000]
我的第一个选择是为每个指标创建一个单独的表并将数据存储如下:
| ID | basin_id | temperature | unit | year | month | temporal_resolution |
|-------|----------|-------------|------|------|-------|---------------------|
| 1 | 1 | 42.1 | k | 2000 | 1 | month |
| 2 | 2 | 1.87 | k | 2000 | 1 | month |
| .. | .. | .. | .. | .. | .. | .. |
| 11001 | 1 | 40.3 | m3 | 2000 | 2 | month |
| 11002 | 2 | 2.3 | m3 | 2000 | 2 | month |
第二个选项创建一个垂直表:
| ID | basin_id | indicator | value | unit | year | month | temporal_resolution |
|-------|----------|-------------|-------|------|------|-------|---------------------|
| 1 | 1 | temperature | 42.1 | k | 2000 | 1 | month |
| 2 | 2 | temperature | 1.87 | k | 2000 | 1 | month |
| .. | .. | .. | .. | .. | .. | .. | .. |
| 11001 | 1 | precipitation | 40.3 | m3 | 2000 | 2 | month |
| 11002 | 2 | precipitation | 2.3 | m3 | 2000 | 2 | month |
我的问题是是否建议或不应该使用拆分指标名称和值。如果数据垂直存储,则总行数将是 appr。 16000*11*12*55=116,160,000 我不确定是否很容易管理。
编辑:由于指标数量有限(12 个左右),因此不需要垂直表结构。第三种选择是将不同的指标表合并成如下内容:
| ID | basin_id | temperature_k | precipitation_m | … | riverdischarge_m3 | year | month | temporal_resolution |
|-------|----------|---------------|-----------------|----|-------------------|------|-------|---------------------|
| 1 | 1 | 42.1 | 42.1 | … | 42.1 | 2000 | 1 | month |
| 2 | 2 | 42.1 | 42.1 | | 42.1 | 2000 | 1 | month |
| .. | .. | .. | .. | .. | .. | .. | .. | .. |
| 11001 | 1 | 42.1 | 42.1 | .. | 42.1 | 2000 | 2 | month |
| 11002 | 2 | 42.1 | 42.1 | .. | 42.1 | 2000 | 2 | month |
这导致 row_count 为 16000 * 55 * 12 = 10,560,000
最佳答案
这似乎是关系数据库中建模继承的示例。
您有一个抽象实体 - “observation” - 具有属性 zone
、year
和 month
,具体实体“temperature_observation”具有“temperature”属性,以及带有“cubic metres”的“precipitation”实体。
这SO question概述了可用的选项——它们都不是特别干净。您的选项 1 是“每个子类的表”。
您的选项 2 不是常见的解决方案之一;它可供您使用,因为您的数据显然只有 2 个属性 - 数量(数字)和测量单位。这种情况并不常见。
方案三是“单表继承”。这是一种常见的设计模式,如果您的子类数量有限,通常可以使用;一旦你得到很多子类,就会变得很难理解。
接下来您需要考虑的是如何查询这些数据。是“返回给定时期/流域的所有记录”的问题吗?在这种情况下,这无关紧要 - 您的两种选择都可以。
如果你想使用数据库进行更复杂的查询——
in which month was the temperature highest and precipitation lowest?
what's the average temperature in basins where precipitation is at least x?
在我看来,选项 1 非常明确 - 任何查看您的数据库查询的人都会一眼就明白您在问什么。您将加入定义问题域的事物 - 流域、年份、月份。
选项 2 和 3 需要自连接,随着条件变得更加复杂,这可能会变得相当复杂且难以阅读。
例如,选项 1 中的问题降水量至少为 x 的盆地的平均温度是多少?
是:
select avg(temperature)
from temperature_facts
where basin_id in
(select basin_id
from precipitation_facts
where precipitation > ?)
在选项 2 中,这变成:
select avg(value)
from facttable
where indicator = 'temperature'
and basin_id in
(select basin_id
from fact_table
where value > ?
and indicator = 'precipitation')
在选项 3 中,它类似于
select avg(temperature)
from fact_table
where basin_id in
(select basin_id
from fact_table
where precipitation > ?)
就我个人而言,我发现选项 1 更具表现力,但这是一个偏好问题。
关于database - 在数据库中拆分值和参数是否可以,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50486168/
我的问题是如何在 python 中创建一个简单的数据库。我的例子是: User = { 'Name' : {'Firstname', 'Lastname'}, 'Address' : {'Street
我需要创建一个与远程数据库链接的应用程序! mysql 是最好的解决方案吗? Sqlite 是唯一的本地解决方案吗? 我使用下面的方法,我想知道它是否是最好的方法! NSString *evento
给定两台 MySQL 服务器,一台本地,一台远程。两者都有一个包含表 bohica 的数据库 foobar。本地服务器定义了用户 'myadmin'@'%' 和 'myadmin'@'localhos
我有以下灵活的搜索查询 Select {vt:code},{vt:productcode},{vw:code},{vw:productcode} from {abcd AS vt JOIN wxyz
好吧,我的电脑开始运行有点缓慢,所以我重置了 Windows,保留了我的文件。因为我的大脑还没有打开,所以我忘记事先备份我的 MySQL 数据库。我仍然拥有所有原始文件,因此我实际上仍然拥有数据库,但
如何将我的 Access 数据库 (.accdb) 转换为 SQLite 数据库 (.sqlite)? 请,任何帮助将不胜感激。 最佳答案 1)如果要转换 db 的结构,则应使用任何 DB 建模工具:
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
我想在相同的 phonegap 应用程序中使用 android 数据库。 更多说明: 我创建了 phonegap 应用程序,但 phonegap 应用程序不支持服务,所以我们已经在 java 中为 a
Time Tracker function clock() { var mytime = new Date(); var seconds
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。 在我的 Controller 中,我(从 ajax 请求)传递了一个时间戳,并且我需要显示之前的 8 个事件。因此,如果时间戳是(转换后)
我有一个可以收集和显示各种测量值的产品(不会详细介绍)。正如人们所期望的那样,显示部分是一个数据库+建立在其之上的网站(使用 Symfony)。 但是,我们可能还会创建一个 API 来向第三方公开数据
我们将 SQL Server 从 Azure VM 迁移到 Azure SQL 数据库。 Azure VM 为 DS2_V2、2 核、7GB RAM、最大 6400 IOPS Azure SQL 数据
我正在开发一个使用 MongoDB 数据库的程序,但我想问在通过 Java 执行 SQL 时是否可以使用内部数据库进行测试,例如 H2? 最佳答案 你可以尝试使用Testcontainers Test
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 已关闭 9 年前。 此问题似乎与 a specific programming problem, a sof
我正在尝试使用 MSI 身份验证(无需用户名和密码)从 Azure 机器学习服务连接 Azure SQL 数据库。 我正在尝试在 Azure 机器学习服务上建立机器学习模型,目的是我需要数据,这就是我
我在我的 MySQL 数据库中使用这个查询来查找 my_column 不为空的所有行: SELECT * FROM my_table WHERE my_column != ""; 不幸的是,许多行在
我有那个基地:http://sqlfiddle.com/#!2/e5a24/2这是 WordPress 默认模式的简写。我已经删除了该示例不需要的字段。 如您所见,我的结果是“类别 1”的两倍。我喜欢
我有一张这样的 table : mysql> select * from users; +--------+----------+------------+-----------+ | userid
我有表: CREATE TABLE IF NOT EXISTS `category` ( `id` int(11) NOT NULL, `name` varchar(255) NOT NULL
我是一名优秀的程序员,十分优秀!