- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们有一个用例促使我写这篇文章,我相信你们中的许多人都会遇到这种情况。这种情况是通过单个 Talend 作业将多个集合从 MongoDB 迁移到 Snowflake 数据库,并将集合的顶级节点保留为 Snowflake 表中的单个字段。
现在我们知道 Talend 不支持 MongoDB 源的动态模式,因为 MongoDB 集合不强制模式,这意味着我们必须为我们想要的每个现有/新集合创建单独的作业/子作业我们还必须重新设计作业以应对文档中的 future 更改,同时确保它始终有效,因此我们必须寻找替代解决方案。
方法是这样的,
第一步:从 MongoDB 集合中获取所有顶级键及其类型。我们使用 $objectToArrray 聚合将所有顶级键和值对转换为文档数组,然后是 $unwind 和 $group 以及 $addToSet 在整个集合中获取不同的键和值类型。
{
"_id" : "1",
"keys" : [
"field1~string",
"field2~object",
"filed3~date",
"_id~objectId"
]
第二步:在 Mongo 数据类型和 Snowflake 数据类型之间创建一对一映射。我们创建了一个名为“dataTypes”的 HashMap 来存储此信息。或者,此信息可以存储在表格或文件等中。
java.util.Map<String,String> dataTypes = new java.util.HashMap<String,String>();
dataTypes.put("string","VARCHAR");
dataTypes.put("int","NUMBER");
dataTypes.put("objectId","VARCHAR");
dataTypes.put("object","VARIANT");
dataTypes.put("date","TIMESTAMP_LTZ");
dataTypes.put("array","VARCHAR");
dataTypes.put("bool","BOOLEAN");
第三步:将键与雪花进行比较:首先我们查询雪花 INFORMATION_SCHEMA 表是否存在,如果不存在则创建表,如果存在则检查更改文档中的字段并添加或修改雪花表中的那些列。 DDL 脚本是通过在第二步中使用“数据类型映射”并在第一步中迭代键来生成的
第四步:使用 mongoexport 命令将数据从 MongoDB 卸载到本地文件系统:
mongoexport --db <databaseName> --collection <collectionName> --type=csv --fields=<fieldList> --out <filename>
这是根据第一步中的键准备的。
第五步:使用 Snowsql 使用 PUT 命令将 .csv 文件从本地文件系统暂存到雪花暂存位置。
snowsql -d <database> -s <schema> -o exit_on_error=true -o log_level=DEBUG -q 'put <fileName> @<internalStage> OVERWRITE=TRUE';
第六步:将暂存位置的数据加载到雪花表
COPY INTO <tableName> FROM @<internalStage>
[file_format=<fileFormat>] [pattern=<regex_pattern>]
在这里指定 file_format 和模式是可选的,我们使用了正则表达式,因为我们在一个雪花阶段为每个集合暂存多个文件。
第七步:维护集合列表,该列表可以放在本地文件系统或数据库表中的文件中,在 Talend 作业中迭代集合列表并通过参数化集合名称通过上述步骤处理每个集合、表名、文件名和暂存名等。
最佳答案
一种解决方案是将您的 Mongodb 集合的记录加载到 variant
的 Snowflake 字段中类型。然后,创建一个雪花 view使用 Snowflake 的 dot notation 提取特定 key .
将您的数据导出为 JSON 类型。
mongoexport --type=json --out <filename>
将该导出加载到具有如下结构的表中。
create table collection_name_exports (
data variant, -- This column will contain your export
inserted_at datetime default current_timestamp()
);
根据需要将键提取到 View 的列中。
create view collection_name_view as
select
collection_name_exports:key1 as field1,
collection_name_exports:key2 as field2
from collection_name_exports
关于mongodb - 将数据从无模式数据库迁移到关系数据库 : MongoDB to Snowflake,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64419220/
我的问题是如何在 python 中创建一个简单的数据库。我的例子是: User = { 'Name' : {'Firstname', 'Lastname'}, 'Address' : {'Street
我需要创建一个与远程数据库链接的应用程序! mysql 是最好的解决方案吗? Sqlite 是唯一的本地解决方案吗? 我使用下面的方法,我想知道它是否是最好的方法! NSString *evento
给定两台 MySQL 服务器,一台本地,一台远程。两者都有一个包含表 bohica 的数据库 foobar。本地服务器定义了用户 'myadmin'@'%' 和 'myadmin'@'localhos
我有以下灵活的搜索查询 Select {vt:code},{vt:productcode},{vw:code},{vw:productcode} from {abcd AS vt JOIN wxyz
好吧,我的电脑开始运行有点缓慢,所以我重置了 Windows,保留了我的文件。因为我的大脑还没有打开,所以我忘记事先备份我的 MySQL 数据库。我仍然拥有所有原始文件,因此我实际上仍然拥有数据库,但
如何将我的 Access 数据库 (.accdb) 转换为 SQLite 数据库 (.sqlite)? 请,任何帮助将不胜感激。 最佳答案 1)如果要转换 db 的结构,则应使用任何 DB 建模工具:
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
我想在相同的 phonegap 应用程序中使用 android 数据库。 更多说明: 我创建了 phonegap 应用程序,但 phonegap 应用程序不支持服务,所以我们已经在 java 中为 a
Time Tracker function clock() { var mytime = new Date(); var seconds
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。 在我的 Controller 中,我(从 ajax 请求)传递了一个时间戳,并且我需要显示之前的 8 个事件。因此,如果时间戳是(转换后)
我有一个可以收集和显示各种测量值的产品(不会详细介绍)。正如人们所期望的那样,显示部分是一个数据库+建立在其之上的网站(使用 Symfony)。 但是,我们可能还会创建一个 API 来向第三方公开数据
我们将 SQL Server 从 Azure VM 迁移到 Azure SQL 数据库。 Azure VM 为 DS2_V2、2 核、7GB RAM、最大 6400 IOPS Azure SQL 数据
我正在开发一个使用 MongoDB 数据库的程序,但我想问在通过 Java 执行 SQL 时是否可以使用内部数据库进行测试,例如 H2? 最佳答案 你可以尝试使用Testcontainers Test
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 已关闭 9 年前。 此问题似乎与 a specific programming problem, a sof
我正在尝试使用 MSI 身份验证(无需用户名和密码)从 Azure 机器学习服务连接 Azure SQL 数据库。 我正在尝试在 Azure 机器学习服务上建立机器学习模型,目的是我需要数据,这就是我
我在我的 MySQL 数据库中使用这个查询来查找 my_column 不为空的所有行: SELECT * FROM my_table WHERE my_column != ""; 不幸的是,许多行在
我有那个基地:http://sqlfiddle.com/#!2/e5a24/2这是 WordPress 默认模式的简写。我已经删除了该示例不需要的字段。 如您所见,我的结果是“类别 1”的两倍。我喜欢
我有一张这样的 table : mysql> select * from users; +--------+----------+------------+-----------+ | userid
我有表: CREATE TABLE IF NOT EXISTS `category` ( `id` int(11) NOT NULL, `name` varchar(255) NOT NULL
我是一名优秀的程序员,十分优秀!