- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
有一个微博类型的应用程序。两个主要的基本数据库存储是:MySQL 或 MongoDB。
我计划对大量数据进行非规范化,即对帖子进行的投票存储在投票表中,并且在主帖子表中增加计数。该帖子还涉及其他操作(例如,喜欢,投反对票)。
如果我使用 MySQL,一些数据比固定模式更适合 JSON,以便更快地查找。
例如
POST_ID | activity_data
213423424 | { 'likes': {'count':213,'recent_likers' :
['john','jack',..fixed list of recent N users]} , 'smiles' :
{'count':345,'recent_smilers' :
['mary','jack',..fixed list of recent N users]} }
应用程序的其他组件也被提议使用 JSON。因此,更新 JSON 字段的顺序是:
在 python 脚本中读取 JSON。
更新 JSON
将 JSON 存储回 MySQL。
这将是 MongoDB 中的单个操作,具有 $push
、$inc
、$pull
等原子操作。还有MongoDB的文档结构很适合我的数据。
我在选择数据存储时的考虑。
关于 MySQL:
关于 MongoDB:
问题:
像主帖这样的一些数据很关键,所以它会使用安全写入、计数器等来保存将使用不安全的写入保存。这种基于数据重要性和写入密集度的策略是否正确?
与 MySQL 相比,监控、备份和恢复 MongoDB 有多容易?我们需要计划定期备份(比如每天),并在发生灾难时轻松恢复它们。我对 MongoDB 的最佳选择是什么,以使其成为应用程序的安全选择。
稳定性、备份、快照、恢复、更广泛的采用,即数据库持久性是指向我的原因将 MySQL 用作 RDBMS+NoSql,即使 NoSQL 文档存储可以更好地满足我的目的。
考虑到我心目中的数据库设计,请将您的观点集中在 MySQL 和 MongoDB 之间的选择上。我知道可能有更好的方法来使用 RDBMS 或 MongoDB 文档来规划数据库设计。但这不是我当前问题的重点。
更新:从 MySQL 5.7 开始,MySQL 支持丰富的原生 JSON 数据类型,它提供了数据灵 active 以及丰富的 JSON 查询。
最佳答案
所以,直接回答问题...
Shall we chose mongodb if half of data is schemaless, and is being stored as JSON if using MySQL?
无模式存储无疑是使用 MongoDB 的一个令人信服的理由,但正如您所指出的,在 RDBMS 中存储 JSON 也相当容易。 MongoDB 的强大之处在于对无模式存储的丰富查询。
如果我可以指出图中关于更新 JSON 字段的一个小缺陷,这不仅仅是获取当前值、更新文档然后将其推回数据库的问题。该过程必须全部包含在事务中。在您开始对数据库进行非规范化之前,事务往往相当简单。然后像记录赞成票这样简单的事情可以锁定整个架构中的表。
使用 MongoDB,没有事务。但是操作几乎总是可以以允许原子更新的方式构造。这通常涉及 SQL 范式的一些戏剧性转变,但在我看来,一旦您停止尝试将对象强制放入表中,它们就相当明显了。至少,很多其他人都遇到了你将面临的同样问题,而且 Mongo 社区往往相当开放,并且对他们所克服的挑战直言不讳。
Some of the data like main posts is critical , so it will be saved using safe writes , the counters etc will be saved using unsafe writes. Is this policy based on importance of data, and write intensiveness correct?
我认为“安全写入”是指在每次写入后打开自动“getLastError()”的选项。我们对 DBCollection 有一个非常薄的包装器,它允许我们对何时调用 getLastError() 进行细粒度控制。但是,我们的政策不是基于数据的“重要程度”,而是基于查询后的代码是否期望任何修改在接下来的读取中立即可见。
一般来说,这仍然是一个糟糕的指标,我们已经迁移到 findAndModify() 以实现相同的行为。在我们仍然显式调用 getLastError() 的情况下,数据库可能会拒绝写入,例如当我们 insert() 的 _id 可能重复时。
How easy is it to monitor,backup and restore Mongodb as compared to mysql? We need to plan periodic backups (say daily), and restore them with ease in case of disaster. What are the best options I have with mongoDb to make it a safe bet for the application?
恐怕我无法谈论我们的备份/恢复政策是否有效,因为我们还没有恢复。我们遵循 MongoDB 备份建议; @mark-hillick 在总结这些方面做得很好。我们正在使用副本集,我们已经迁移了 MongoDB 版本并引入了新的副本成员。到目前为止,我们没有停机时间,所以我不确定我能不能说得好。
Stability,backup,snapshots,restoring,wider adoption i.e.database durability are the reasons pointing me to use MySQL as RDBMS+NoSql even though a NoSQL document storage could serve my purpose better.
因此,根据我的经验,MongoDB 使用一组足够丰富的查询原语来存储无模式数据,以至于事务通常可以被原子操作替换。忘记 10 多年的 SQL 经验是很困难的,但我遇到的每个问题都已由社区或 10gen 直接解决。我记得我们没有丢失数据或有任何停机时间。
简单地说,就查询、维护、可扩展性和可靠性而言,MongoDB 是我用过的最好的数据存储生态系统。除非我有一个非常明确的关系应用程序,以至于我良心上只能使用 SQL 以外的任何东西,否则我会尽一切努力使用 MongoDB。
我不为 10gen 工作,但我非常感谢那些为 10gen 工作的人。
关于mysql - 使用带有大量 JSON 字段的 MongoDB 与 MySQL?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12934385/
最近开始学习MongoDB。今天老师教了我们 mongoexport 命令。在练习时,我遇到了一个典型的问题,包括教练在内的其他同学都没有遇到过。我在我的 Windows 10 机器上使用 Mongo
我是 JSON Schema 的新手,读过什么是 JSON Schema 等等。但我不知道如何将 JSON Schema 链接到 JSON 以针对该 JSON Schema 进行验证。谁能解释一下?
在 xml 中,我可以在另一个 xml 文件中包含一个文件并使用它。如果您的软件从 xml 获取配置文件但没有任何方法来分离配置,如 apache/ngnix(nginx.conf - site-av
我有一个 JSON 对象,其中包含一个本身是 JSON 对象的字符串。我如何反序列化它? 我希望能够做类似的事情: #[derive(Deserialize)] struct B { c: S
考虑以下 JSON { "a": "{\"b\": 12, \"c\": \"test\"}" } 我想定义一个泛型读取 Reads[Outer[T]]对于这种序列化的 Json import
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 11 个月前关闭。 Improve
我的旧项目在 MySQL 中有 Standard JSON 格式的数据。 对于我在 JS (Node.js) 和 DynamoDB 中的全新项目,关于 Standard JSON格式: 是否建议将其转
JSON 值字符串、数字、true、false、null 是否是有效的 JSON? 即,是 true 一个有效的 JSON 文档?还是必须是数组/对象? 一些验证器接受这个(例如 http://jso
我有一个 JSON 字符串,其中一个字段是文本字段。这个文本字段可以包含用户在 UI 中输入的文本,如果他们输入的文本是 JSON 文本,也许是为了说明一些编码,我需要对他们的文本进行编码,以便它不会
我正在通过 IBM MQ 调用处理数据,当由 ColdFusion 10 (10,0,11,285437) 序列化时,0 将作为 +0.0 返回,它会导致无效的 JSON并且无法反序列化。 stPol
我正在从三个数组中生成一个散列,然后尝试构建一个 json。我通过 json object has array 成功了。 require 'json' A = [['A1', 'A2', 'A3'],
我从 API 接收 JSON,响应可以是 30 种类型之一。每种类型都有一组唯一的字段,但所有响应都有一个字段 type 说明它是哪种类型。 我的方法是使用serde .我为每种响应类型创建一个结构并
我正在下载一个 JSON 文件,我已将其检查为带有“https://jsonlint.com”的有效 JSON 到文档目录。然后我打开文件并再次检查,结果显示为无效的 JSON。这怎么可能????这是
我正在尝试根据从 API 接收到的数据动态创建一个 JSON 对象。 收到的示例数据:将数据解码到下面给出的 CiItems 结构中 { "class_name": "test", "
我想从字符串转换为对象。 来自 {"key1": "{\n \"key2\": \"value2\",\n \"key3\": {\n \"key4\": \"value4\"\n }\n
目前我正在使用以下代码将嵌套的 json 转换为扁平化的 json: import ( "fmt" "github.com/nytlabs/gojsonexplode" ) func
我有一个使用来自第三方 API 的数据的应用程序。我需要将 json 解码为一个结构,这需要该结构具有“传入”json 字段的 json 标签。传出的 json 字段具有不同的命名约定,因此我需要不同
我想使用 JSON 架构来验证某些值。我有两个对象,称它们为 trackedItems 和 trackedItemGroups。 trackedItemGroups 是组名称和 trackedItem
考虑以下案例类模式, case class Y (a: String, b: String) case class X (dummy: String, b: Y) 字段b是可选的,我的一些数据集没有字
我正在存储 cat ~/path/to/file/blah | 的输出jq tojson 在一个变量中,稍后在带有 JSON 内容的 curl POST 中使用。它运作良好,但它删除了所有换行符。我知
我是一名优秀的程序员,十分优秀!