mongodb - 数百万个事件的良好数据存储？-6ren

mongodb - 数百万个事件的良好数据存储？

转载作者：行者123 更新时间：2023-12-02 22:47:27

25

4

我们有许多系统每天会产生大约500万个事件。目前，我们将这些内容保存了大约10天，总计40-50M个事件。当前，我们将RDBMS用作持久化层，并在上面粘贴了Web GUI。但是，我们遇到了某些性能问题。

一个事件由20-30个字段组成，这些字段由以下内容组成:

代表事件本身的

字段(例如OrderReceived)

代表生成事件的系统的

字段(例如ERP系统)

字段，代表在其中生成事件的业务环境(例如OrderManagement)

字段，表示我们认为相关/重要的

其他详细信息

大约5-6个字段是标识符，其中大多数是唯一的，代表事件本身，业务实体/对象，上下文等。使用这些标识符，我们还可以将事件彼此关联起来，从而将它们链接在一起。事件链中的时间差可能是几个小时，或者在极少数情况下甚至是几天。

当前，我们使用该解决方案来分析单个事件链，主要用于错误和异常值分析(我的订单去了哪里？)。将来，我们还可能希望收集有关事件和事件链的统计信息(每天多少订单？系统X处理多少订单？)。如果可能的话，该解决方案还应该至少能够增长到当前大小的两倍(我们预计，启用新系统后事件数量将会增加)。今天，分析目前是由人类执行的，因此搜索必须是可以容忍的(搜索事件链应该花费几秒钟，而不是几分钟)。数据存储区还应允许清除陈旧事件。

如开头所述，我们为此使用了标准的RDBMS。我们使用的是相当规范的结构，我们现在开始对其进行非规范化以尝试提高性能。我不禁想知道其他解决方案是否会更好。我已经开始研究不同的NoSQL数据库(我个人认为MongoDB似乎很有前途)，但也尝试收集有关搜索引擎等类似信息(例如Solr和ElasticSearch)。

问题是哪种类型的数据存储/解决方案最适合这些事件？我们应该进入NoSQL Realm ，还是我们想要的搜索引擎，或者当我们真正需要的是找到一个真正擅长优化RDBMS的人时，是否树错了树？

最佳答案

我会建议一个混合解决方案，其中包括用于实际存储的常规SQL Server和基于Lucene的前端搜索引擎，该引擎是根据某些自动事件或定时事件从SQL中填充的。 Web层查询Lucene层并编写SQL。

SQL后端使您的选择在将来可以继续使用(OLAP ??等)，并且还提供了一种标准，可扩展和多用户的方式，可以通过dbconnection库和ui工具从世界接受数据。简而言之，如果您的数据存储在SQL中，则不会丢失...

如果Lucene层提供了足够的查询功能，则它可以提供出色的查询性能。 (简而言之:对数字，日期，字符串等进行字段值搜索，范围搜索，对多个字段值进行搜索(字段实际上是一个数组)，所有这些都具有逻辑运算符和逻辑二进制表达式，进行排序和分页。但是，它不能做分组和求和，平均等汇总函数)。

更新:几年过去了。 Solr现在具有统计功能，例如sum，avg等。

查询性能:在一个100M记录项目数据库中，选择数百个具有多字段查询谓词的项目在100ms以下。

由于内部splitfile的实现，填充索引花费的时间是恒定的(大小不会增加)。几分钟之内就可以建立一个500万行的索引，这主要取决于您的存储 Controller 而达到20个索引。但是，Lucence支持对索引的实时更新，这一功能在高负载网站上已得到广泛使用并获得成功。

Lucene支持将索引拆分为子索引和索引层次结构，因此您可以每天创建一个索引，但是可以通过单个查询(使用多索引适配器)在所有索引(或索引的特定子集中)中进行搜索。我用2000个唯一索引文件进行了尝试，其性能令人赞叹。

这些架构可以在Java和.NET中轻松完成，它们都具有强大的SQL和Lucene支持。

关于mongodb - 数百万个事件的良好数据存储？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9949413/

25

4

0

文章推荐： search - 使用River插件时如何创建初始Elasticsearch设置

文章推荐： file - 在powershell中删除回车

mongodb - 使用 mongodb+srv 连接到部署为有状态集的 mongodb
我已经在 kubernetes 中部署了一个 3 pod mongodb statefulset，并且我正在尝试使用新的 mongodb+srv 连接字符串 (mongodb 3.6) 连接到具有 S
mongodb - 如何使用 MongoDB Atlas 连接 MongoDB
我已经创建了 MongoDB Atlas 帐户，并尝试连接。但出现以下错误。 MongoDB 连接错误 MongoNetworkError: 首次连接时无法连接到服务器 [cluster0-shard
mongodb - JsonLD+MongoDB : Store JsonLD in MongoDB
我正在使用 Node-WebKit 创建桌面应用程序。该应用程序基本上是创建文档(员工日常工作的详细信息)，任何注册用户都可以对这些文档发表评论。我正在创建的文档将被分成几个部分。用户将对特定部分发表
mongodb - 服务 'MongoDB Server' (MongoDB) 启动失败
我正在尝试使用官方网站上的安装程序在我的本地机器上安装 mongo DB。但是我不断收到这条消息，有人可以帮忙吗？我试过提供的解决方案 here但没有帮助。最佳答案我建议执行以下操作: 按 Wi
mongodb - 如何使用 MongoDB 指南针删除 MongoDB 集合中选定的多条记录
我对 MongoDB 和 MongoDB Compass 非常陌生。我的客户集合中有大约 1000 条记录。如何通过 MongoDB 指南针一次删除所有记录。非常感谢，最佳答案您可以使用 Mo
mongodb - mongodb 和 mongodb-server 的区别
当我尝试在我的 Ubuntu 机器中安装 mongodb 时，apt-get 会显示以下选项 mongodb mongodb-clients mongodb-dev mongodb-server 谁能
mongodb - 如何将 mongodb 客户端连接到本地 Meteor MongoDB
如何将 Robomongo(或任何其他 mongodb 客户端)连接到由本地 Meteor 应用程序创建的 mongodb 实例？最佳答案确保 Meteor 正在本地主机上运行。打开终端窗口并运行
mongodb - 频率表生成 - MongoDB
我需要在 MongoDB 中生成一个简单的频率表。假设我在名为 books 的集合中有以下文档。 { "_id": 1, genre: [ "Fantasy", "Crime"
mongodb - mongodb mapreduce中的where条件
我如何在 mongos mapreduce 中指定一个条件，就像我们在 mongos group 函数中所做的那样。我的数据是这样的 {lid:1000, age:23}, {lid:3000, a
mongodb - 从 mongodb shell 运行具有 mongodb 查询的脚本
我的 mongodb 数据库文档中有几个 ID。我需要通过脚本在这些 ID 上创建索引，这样我就不必一次又一次地运行 ensureIndex 命令。 db.getCollection("element
mongodb - 比较嵌套数组中的对象 - mongoDB
在我的数据库中，每个包含项目的文档中都有一个嵌套的元素数组，格式如下: elements:[ { "elem_id": 12, items: [ {"i_id": 1
mongodb - MongoDB 上的时区查询
我正在构建一个应用程序，其中用户可以位于不同的时区，并且我运行的查询对他们的时区很敏感。我遇到的问题是 MongoDB 似乎在查询时忽略了时区! 这是日期字段“2019-09-29T23:52:13
mongodb - 为什么当我添加新集合时只有一个分片获取数据？ - MongoDB
我正在研究使用 mongodb 进行分片，我有以下结构: 1 个 Mongod 到我的 ConfigServer，在 ReplicaSet 中只有 1 个成员 2 个分片，每个分片在 ReplicaS
mongodb - mongoDB 中是否可以使用循环对象引用？
我正在尝试获取一个 mongoDB 对象，例如 Friend1 包含另一个 mongoDB 对象 Friend2，该对象又包含第一个对象 Friend1本质上使它成为一个循环对象引用。要么这样，要么
mongodb - 通过命令行正确卸载 MongoDB
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题？ Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
mongodb - 无法通过终端使用身份验证数据连接 mongodb
Mongo 版本 5.0.2。 Ubuntu 20.0 我在本地主机中启用了 MongoDB 连接的安全性。我正在尝试通过以下命令使用身份验证详细信息连接我的本地主机 MongoDBmongo ad
mongodb - 当配置实例使用与数据实例相同的二进制文件时升级 Mongodb
我即将将分片的 MongoDB 环境从 2.0.7 升级到 2.2.9，最终我想升级到 2.4.9，但显然我需要通过 2.2 来完成。 2.2 的发行说明声明配置服务器应该首先升级其二进制文件，然后是
mongodb - 无法远程连接到 mongodb
目前，我无法在我的虚拟 Ubuntu 机器上远程连接 mongodb 服务器。我无法使用在我的 Windows PC 上运行的 Robomongo 客户端连接，该 PC 也运行 vm。这是两台电脑的
mongodb - 如何从 mongodb compass 连接 mongodb 集群？
我创建了一个免费的 mongodb 集群。我创建了一个用户，设置了与 mongodb compass 的连接，复制了连接字符串，然后打开了我的 mongodb compass。将复制的字符串粘贴到那里
mongodb - MongoDB 索引名称
我使用 java 代码创建了 mongo 数据库集合索引 dbCollection.createIndex("accountNumber"); 当我看到索引使用 db.accounts.getInde

首页

博学

6Ren·AI

商城

mongodb - 数百万个事件的良好数据存储？