- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我需要为大量网站实现定制开发的网络分析服务。这里的关键实体是:
每个唯一身份访问者在数据库中都有一行,其中包含着陆页、一天中的时间、操作系统、浏览器、引荐来源网址、IP 等信息。
我需要对该数据库进行聚合查询,例如“计算所有使用 Windows 作为操作系统并来自 Bing.com 的访问者”
我有数百个网站需要跟踪,这些网站的访问者数量从每天几百到几百万不等。总的来说,我预计这个数据库每天会增长大约一百万行。
我的问题是:
1) MySQL 是适合此目的的数据库吗?
2) 什么是好的架构?我正在考虑为每个网站创建一个新表。或者,如果现有表中的行数超过 100 万(我的假设是否正确),也许从单个表开始,然后(每天)生成一个新表。我唯一担心的是,如果表变得太大,SQL 查询会变得非常慢。那么,我应该在每个表中存储的最大行数是多少?此外,MySQL 可以处理的表数是否有限制。
3) 对数百万行进行聚合查询是否可取?我准备等待几秒钟以获取此类查询的结果。这是一个好的做法还是有任何其他方法来进行聚合查询?
简而言之,我正在尝试设计一种大型数据仓库类型的设置,这种设置会很繁重。如果您知道任何已发表的案例研究或报告,那就太好了!
最佳答案
如果您谈论的是大量数据,请查看 MySQL partitioning .对于这些表,按数据/时间进行分区肯定会提高性能。有一篇关于分区的不错的文章 here .
看看创建两个独立的数据库:一个用于写入的所有原始数据,索引最少;第二个用于使用汇总值进行报告;使用批处理从原始数据数据库更新报告数据库,或使用复制为您完成。
编辑
如果您想真正巧妙地处理汇总报告,请创建一组汇总表(“今天”、“本周至今”、“本月至今”、“按年”)。每天或“实时”从原始数据汇总到“今天”;每晚从“按天”汇总到“迄今为止的一周”;每周从“周至今”到“月至今”等。执行查询时,为您感兴趣的日期范围加入(UNION)适当的表。
编辑#2
我们不是每个客户端一个表,而是每个客户端使用一个数据库架构。根据客户端的大小,我们可能在单个数据库实例中有多个模式,或者每个客户端有一个专用的数据库实例。我们为原始数据收集和每个客户的聚合/报告使用单独的模式。我们运行多个数据库服务器,将每个服务器限制为单个数据库实例。为实现弹性,数据库在多台服务器之间复制并进行负载平衡以提高性能。
关于mysql - 每天数百万新行的数据库架构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3509704/
我的问题是如何在 python 中创建一个简单的数据库。我的例子是: User = { 'Name' : {'Firstname', 'Lastname'}, 'Address' : {'Street
我需要创建一个与远程数据库链接的应用程序! mysql 是最好的解决方案吗? Sqlite 是唯一的本地解决方案吗? 我使用下面的方法,我想知道它是否是最好的方法! NSString *evento
给定两台 MySQL 服务器,一台本地,一台远程。两者都有一个包含表 bohica 的数据库 foobar。本地服务器定义了用户 'myadmin'@'%' 和 'myadmin'@'localhos
我有以下灵活的搜索查询 Select {vt:code},{vt:productcode},{vw:code},{vw:productcode} from {abcd AS vt JOIN wxyz
好吧,我的电脑开始运行有点缓慢,所以我重置了 Windows,保留了我的文件。因为我的大脑还没有打开,所以我忘记事先备份我的 MySQL 数据库。我仍然拥有所有原始文件,因此我实际上仍然拥有数据库,但
如何将我的 Access 数据库 (.accdb) 转换为 SQLite 数据库 (.sqlite)? 请,任何帮助将不胜感激。 最佳答案 1)如果要转换 db 的结构,则应使用任何 DB 建模工具:
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
我想在相同的 phonegap 应用程序中使用 android 数据库。 更多说明: 我创建了 phonegap 应用程序,但 phonegap 应用程序不支持服务,所以我们已经在 java 中为 a
Time Tracker function clock() { var mytime = new Date(); var seconds
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。 在我的 Controller 中,我(从 ajax 请求)传递了一个时间戳,并且我需要显示之前的 8 个事件。因此,如果时间戳是(转换后)
我有一个可以收集和显示各种测量值的产品(不会详细介绍)。正如人们所期望的那样,显示部分是一个数据库+建立在其之上的网站(使用 Symfony)。 但是,我们可能还会创建一个 API 来向第三方公开数据
我们将 SQL Server 从 Azure VM 迁移到 Azure SQL 数据库。 Azure VM 为 DS2_V2、2 核、7GB RAM、最大 6400 IOPS Azure SQL 数据
我正在开发一个使用 MongoDB 数据库的程序,但我想问在通过 Java 执行 SQL 时是否可以使用内部数据库进行测试,例如 H2? 最佳答案 你可以尝试使用Testcontainers Test
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 已关闭 9 年前。 此问题似乎与 a specific programming problem, a sof
我正在尝试使用 MSI 身份验证(无需用户名和密码)从 Azure 机器学习服务连接 Azure SQL 数据库。 我正在尝试在 Azure 机器学习服务上建立机器学习模型,目的是我需要数据,这就是我
我在我的 MySQL 数据库中使用这个查询来查找 my_column 不为空的所有行: SELECT * FROM my_table WHERE my_column != ""; 不幸的是,许多行在
我有那个基地:http://sqlfiddle.com/#!2/e5a24/2这是 WordPress 默认模式的简写。我已经删除了该示例不需要的字段。 如您所见,我的结果是“类别 1”的两倍。我喜欢
我有一张这样的 table : mysql> select * from users; +--------+----------+------------+-----------+ | userid
我有表: CREATE TABLE IF NOT EXISTS `category` ( `id` int(11) NOT NULL, `name` varchar(255) NOT NULL
我是一名优秀的程序员,十分优秀!