- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我有一个包含 6 个表和大约 200 万行的 MySQL 数据库。
我想将所有数据迁移到 MongoDB。
我决定通过将 SQL 表转换为 JSON 并将其导入 MongoDB 来实现此目的。
我用 Golang 编写了一个程序来提取数据并将其输出为 JSON。
这是程序的主要功能:
func main() {
// Open a database connection
var err error
db, err = sql.Open("mysql", "root:password@tcp(127.0.0.1:3306)/employees")
checkErr(err)
// Check if reachable
if err = db.Ping(); err != nil {
log.Fatal("Database is unreachable:", err)
}
// Populate variables with data
err = populateVars()
checkErr(err)
// Marshal variables into JSON
binaryJSON, err := json.Marshal(collection)
checkErr(err)
// Write JSON to a file
err = writeStringToFile("/home/user01/Temporary/sql2data.json", string(binaryJSON))
checkErr(err)
}
问题是输出不一致。
每次我运行该程序时,生成的文件都有不同的大小,并且缺少一些随机字段。
这可能是什么原因造成的?
这似乎不是程序逻辑的问题,因为一切都没有错误地执行,并且大多数字段都被填充得很好。
我是否阅读信息速度过快,以至于偶尔会丢失某些内容?
还是我还缺少其他东西?
编辑:
大部分工作发生在 populateVars()
函数调用中。
它有多个代码块,可执行给定的 SQL 查询并根据模式填充结构变量。
这是一个这样的 block :
rows, err = db.Query("SELECT emp_no, dept_emp.dept_no, dept_name, from_date, to_date FROM dept_emp JOIN departments ON departments.dept_no = dept_emp.dept_no;")
checkErr(err)
i := 0
for rows.Next() {
var id int
var depNumber string
var depName string
var fromDate string
var toDate string
var position = "Employee"
err = rows.Scan(&id, &depNumber, &depName, &fromDate, &toDate,)
// For debugging purposes:
fmt.Println(id, depNumber, depName, fromDate, toDate, position, i)
if err != nil {
return err
}
for i := range collection {
if collection[i].ID == id {
collection[i].Departments = append(collection[i].Departments, Department{DepartmentNumber: depNumber, DepartmentName: depName, FromDate: fromDate, ToDate: toDate, Position: position})
// For debugging purposes:
fmt.Println(collection[i].Departments)
}
}
i++
}
这是整个程序的 GitHub 链接: https://github.com/dchmie01/mysql_to_json/blob/master/main.go
编辑 2:
问题似乎与查询超时有关。
每个查询执行大约需要 10 分钟,但在大约 6 分钟后,我收到此错误,程序停止执行查询:
[mysql] 2017/04/29 17:35:16 packets.go:66: unexpected EOF
[mysql] 2017/04/29 17:35:16 packets.go:412: busy buffer
2017/04/29 17:35:16 driver: bad connection
在 MySQL 日志文件中它说:
2017-04-29T16:28:49.975805Z 102 [Note] Aborted connection 102 to db: 'employees' user: 'root' host: 'localhost' (Got timeout writing communication packets)
到目前为止,我尝试使用 MySQL 变量来禁用任何可能存在的超时,但没有成功。
我认为问题可能出在 Go 的 mysql
驱动程序上。
最佳答案
考虑使用Mysql SELECT INTO OUTFILE和 mongoiport --type csv相反。
该程序唯一要做的就是嵌入一对多和多对多文档,这可以通过聚合框架轻松完成。
一步一步的例子:
从 mysql 导出 csv
SELECT * from employees INTO OUTFILE '/tmp/employees.csv' FIELDS TERMINATED BY ',' ENCLOSED BY '"';
SELECT * from salaries INTO OUTFILE '/tmp/salaries.csv' FIELDS TERMINATED BY ',' ENCLOSED BY '"';
SELECT * from titles INTO OUTFILE '/tmp/titles.csv' FIELDS TERMINATED BY ',' ENCLOSED BY '"';
SELECT * from departments INTO OUTFILE '/tmp.departments.csv' FIELDS TERMINATED BY ',' ENCLOSED BY '"';
SELECT * from dept_emp INTO OUTFILE '/tmp/dept_emp.csv' FIELDS TERMINATED BY ',' ENCLOSED BY '"';
SELECT * from dept_manager INTO OUTFILE '/tmp/dept_manager.csv' FIELDS TERMINATED BY ',' ENCLOSED BY '"';
将 csv 导入 mongo(根据您的架构定义“字段规范”,请参阅员工字段规范示例)
mongoimport -d <dbname> -c tmp_employees -f 'id.int32(),birth.date(2006-01-02),first_name.string(),last_name.string(),gender.string(),hire_date.date(2006-01-02)' --columnsHaveTypes --type csv --file /tmp/employees.csv --drop
mongoimport -d <dbname> -c tmp_salaries -f 'field spec' --columnsHaveTypes --type csv --file /tmp/salaries.csv --drop
mongoimport -d <dbname> -c tmp_titles -f 'field spec' --columnsHaveTypes --type csv --file /tmp/titles.csv --drop
mongoimport -d <dbname> -c tmp_departments -f 'field spec' --columnsHaveTypes --type csv --file /tmp/departments.csv --drop
mongoimport -d <dbname> -c tmp_dept_emp -f 'field spec' --columnsHaveTypes --type csv --file /tmp/dept_emp.csv --drop
mongoimport -d <dbname> -c tmp_dept_manager -f 'field spec' --columnsHaveTypes --type csv --file /tmp/dept_manager.csv --drop
从 mongo shell 嵌入数据
db.tmp_employees.aggregate([
// 1-to-many joins
{$lookup: {
from: 'tmp_salaries',
localField: 'id',
foreignField: 'emp_no',
as: 'salaries'
}},
{$lookup: {
from: 'tmp_titles',
localField: 'id',
foreignField: 'emp_no',
as: 'titles'
}},
// many-to-many joins
{$lookup: {
from: 'tmp_dept_emp',
localField: 'id',
foreignField: 'emp_no',
as: 'dept_emp'
}},
{$lookup: {
from: 'tmp_dept_manager',
localField: 'id',
foreignField: 'emp_no',
as: 'dept_manager'
}},
{$unwind: { path: '$dept_emp', preserveNullAndEmptyArrays: true }},
{$lookup: {
from: 'tmp_departments',
localField: 'dept_emp.dept_no',
foreignField: 'dept_no',
as: 'dept_emp_deps'
}},
{$unwind: { path: '$dept_emp_deps', preserveNullAndEmptyArrays: true }},
{$group: {
_id: '$_id',
root: {$first: '$$ROOT'},
dept_manager: {$first: '$dept_manager'},
departments_emp: {$push: {
department_number: '$dept_emp.emp_no',
department_name: '$dept_emp_deps.dept_name',
from_date: '$dept_emp.from_date',
to_date: '$dept_emp.to_date',
position: '$dept_emp.position'
}},
}},
{$unwind: { path: '$dept_manager', preserveNullAndEmptyArrays: true }},
{$lookup: {
from: 'tmp_departments',
localField: 'dept_manager.dept_no',
foreignField: 'dept_no',
as: 'dept_manager_deps'
}},
{$unwind: { path: '$dept_manager_deps', preserveNullAndEmptyArrays: true }},
{$group: {
_id: '$_id',
root: {$first: '$root'},
departments_emp: {$first: '$departments_emp'},
departments_manager: {$push: {
department_number: '$dept_manager.emp_no',
department_name: '$dept_manager_deps.dept_name',
from_date: '$dept_manager.from_date',
to_date: '$dept_manager.to_date',
position: '$dept_manager.position'
}},
}},
// combine departments to a single array
{$project: {
root: 1,
departments_all: {$concatArrays: [ "$departments_emp", "$departments_manager" ] }
}},
//final reshape
{$project: {
id: '$root.id',
birth_date: '$root.birth_date',
first_name: '$root.first_name',
last_name: '$root.last_name',
gender: '$root.gender',
hire_date: '$root.hire_date',
salaries: '$root.salaries',
titles: '$root.titles',
departments: {$filter: {
input: "$departments_all",
as: "departments",
cond: { $ne: [ "$$departments", {} ] }}}
}},
{ $out : "employees" }
])
从 mongo shell 中删除导入的集合
db.tmp_employees.drop();
db.tmp_salaries.drop();
db.tmp_titles.drop();
db.tmp_departments.drop();
db.tmp_dept_emp.drop();
db.tmp_dept_manager.drop();
关于MySQL 到 JSON 不一致提取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43696607/
我正在做一个业余爱好项目,使用 Ruby、PHP 或 Java 来抓取 ASP.net 网站的内容。例如,如果网站 url“www.myaspnet.com/home.aspx”。我想从 home.a
如果我有这些字符串: mystrings <- c("X2/D2/F4", "X10/D9/F4", "X3/D22/F4",
我有以下数据集 > head(names$SAMPLE_ID) [1] "Bacteria|Proteobacteria|Gammaproteobacteria|Pseudomonadales|Mor
设置: 3个域类A,B和C。A和B在插件中。 C在依赖于此插件的应用程序中。 class A{ B b static mapping = { b fetch: 'joi
我不知道如何提取 XML 文件中的开始标记元素名称。我很接近〜意味着没有错误,我正在获取标签名称,但我正在获取标签名称加上信息。我得到的是: {http://www.publishing.org}au
我有一个字符串 x <- "Name of the Student? Michael Sneider" 我想从中提取“Michael Sneider”。 我用过: str_extract_all(x,
我有一个如下所示的文本文件: [* content I want *] [ more content ] 我想读取该文件并能够提取我想要的内容。我能做的最好的事情如下,但它会返回 [更多内容] 请注意
假设我有一个项目集合 $collection = array( 'item1' => array( 'post' => $post, 'ca
我正在寻找一种过滤文本文件的方法。我有许多文件夹名称,其中包含许多文本文件,文本文件有几个没有人员,每个人员有 10 个群集/组(我在这里只显示了 3 个)。但是每个组/簇可能包含几个原语(我在这里展
我已经编写了一个从某个网页中提取网址的代码,我面临的问题是它不会以网页上相同的方式提取网址,我的意思是如果该网址位于某些网页中法语,它不会按原样提取它。我该如何解决这个问题? import reque
如何在 C# 中提取 ZipFile?(ZipFile 是包含文件和目录) 最佳答案 为此使用工具。类似于 SharpZip .据我所知 - .NET 不支持开箱即用的 ZIP 文件。 来自 here
我有一个表达: [training_width]:lofmimics 我要提取[]之间的内容,在上面的例子中我要 training_width 我试过以下方法: QRegularExpression
我正在尝试创建一个 Bash 脚本,该脚本将从命令行给出的最后一个参数提取到一个变量中以供其他地方使用。这是我正在处理的脚本: #!/bin/bash # compact - archive and
我正在寻找一个 JavaScript 函数/正则表达式来从 URI 中提取 *.com...(在客户端完成) 它应该适用于以下情况: siphone.com = siphone.com qwr.sip
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this qu
编辑:添加了实际的 JSON 对象和代码以供审查 我有这种格式的 JSON(只是这种层次结构,假设 JSON 正常工作) {u'kind': u'calendar#events', u'default
我已经编写了代码来使用 BeautifulSoup 提取一本书的 url 和标题来自页面。 但它并没有在 > 之间提取惊人的 super 科学故事 1930 年 4 月这本书的名字。和 标签。 如何提
使用 Java,我想提取美元符号 $ 之间的单词。 例如: String = " this is first attribute $color$. this is the second attribu
您好,我正在尝试找到一种方法来确定字符串中的常量,然后提取该常量左侧的一定数量的字符。 例如-我有一个 .txt 文件,在那个文件的某处有数字 00nnn 数字的例子是 00234 00765 ...
php读取zip文件(删除文件,提取文件,增加文件)实例 从zip压缩文件中提取文件 复制代码 代码如下: <?php /* php 从zip压缩文件
我是一名优秀的程序员,十分优秀!