gpt4 book ai didi

如何用分表存储来提高性能

转载 作者:qq735679552 更新时间:2022-09-29 22:32:09 35 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章如何用分表存储来提高性能由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

首先,童家旺介绍了他认为的什么是优化:第1、做任何事情最快的方法就是什么也不做.

如何用分表存储来提高性能

▲支付宝资深数据库架构师童家旺 。

第2、不访问不必要的数据:使用B*Tree/hash等方法定位必要的数据。使用column Store或分表的方式将数据分开存储。使用Bloom filter算法排除空值查询.

第3、合理的利用硬件来提升访问效率:使用缓存消除对数据的重复访问。使用批量处理来减少磁盘的Seek操作。使用批量处理来减少网络的Round Trip。使用SSD来提升磁盘访问效率.

响应时间和吞吐量之间的关系 。

1、性能。衡量完成特定任务的速度或效率.

2、响应时间。衡量系统与用户交互式多久能够发出响应.

3、吞吐量。衡量系统在单位时间里可以完成的任务量.

如何用分表存储来提高性能

▲反应时间 。

如何用分表存储来提高性能

▲传统磁盘的访问特性 。

B*Tree优化数据访问介绍 。

如何用分表存储来提高性能

▲B*Tree优化数据访问 。

B*Tree优化数据访问模拟场景 。

如何用分表存储来提高性能

▲B*Tree优化数据访问模拟场景 。

童家旺通过阿里巴巴的真实应用场景介绍了如何用分表存储来提高性能.

1、场景介绍:

1、表VeryBigTable含有30个列 。

2、表的记录数为50,000,000条 。

3、平均每个用户为300条左右 。

4、其中有2个列属于详细描述字段,平均长度为2k 。

5、其它的列的总长度平均为250个字节 。

6、此表上的查询有两种模式 。

7、列出表中的主要信息(每次20条,不包含详细信息,90%的查询) 。

8、查看记录的详细信息(10%的查询) 。

9、保存与Oracle数据库,默认block_size(8k) 。

2、要求:

1、对此业务进行优化 。

2、分析数据,说服开发部门实施此优化 。

3、性能分析 。

1、每块记录数 。

8192 * 0.80(1) / 250 = 25.5 (主表) 。

8192 * 0.80 / 2000 = 3.27(详情表) 。

8192 * 0.80 / ( 2000 + 250 ) = 2.91 。

2、访问的逻辑IO(内存块访问) 。

List的查询代价 。

改进后=( 300/25.5 ) * y + 4 + x = 4 + x + 11.8y = 4(2) + 7(3) + 11.8 * 1.5(4) = 28.7 。

改进前=( 300/2.91 ) * y + 4 + x = 4 + x + 103.y = 4 + 7 + 103 * 1.5 = 165.5 。

3、访问涉及到的物理读(磁盘块访问) 。

List的查询代价(逻辑IO * ( 1 – 命中率 )) 。

改进后=28.7 * ( 1 – 0.85(5)) = 4.305 。

改进前=165.5 * ( 1 – 0.85 ) = 24.825 。

4、访问时间(ms) 。

改进前=逻辑IO时间+物理IO时间= 28.7 * 0.01(6) + 4.305 * 7(7) = 30.422ms 。

改进后=逻辑IO时间+物理IO时间= 165.5 * 0.01 + 24.825 * 7 = 175.43ms 。

最后此篇关于如何用分表存储来提高性能的文章就讲到这里了,如果你想了解更多关于如何用分表存储来提高性能的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com