如何用分表存储来提高性能推荐-侯体宗的博客

如何用分表存储来提高性能推荐
技术 / 管理员发布于 8年前 170

首先，童家旺介绍了他认为的什么是优化：第一、做任何事情最快的方法就是什么也不做。

▲支付宝资深数据库架构师童家旺

　　第二、不访问不必要的数据：使用B*Tree/hash等方法定位必要的数据。使用column Store或分表的方式将数据分开存储。使用Bloom filter算法排除空值查询。

　　第三、合理的利用硬件来提升访问效率：使用缓存消除对数据的重复访问。使用批量处理来减少磁盘的Seek操作。使用批量处理来减少网络的Round Trip。使用SSD来提升磁盘访问效率。

　　响应时间和吞吐量之间的关系

　　1、性能。衡量完成特定任务的速度或效率。

　　2、响应时间。衡量系统与用户交互式多久能够发出响应。

　　3、吞吐量。衡量系统在单位时间里可以完成的任务量。

　　▲反应时间

　　▲传统磁盘的访问特性

　　B*Tree优化数据访问介绍

　　▲B*Tree优化数据访问

　　B*Tree优化数据访问模拟场景

　　▲B*Tree优化数据访问模拟场景

　　童家旺通过阿里巴巴的真实应用场景介绍了如何用分表存储来提高性能。

　　一、场景介绍：

　　1、表VeryBigTable含有30个列

　　2、表的记录数为50,000,000条

　　3、平均每个用户为300条左右

　　4、其中有2个列属于详细描述字段,平均长度为2k

　　5、其它的列的总长度平均为250个字节

　　6、此表上的查询有两种模式

　　7、列出表中的主要信息(每次20条,不包含详细信息,90%的查询)

　　8、查看记录的详细信息(10%的查询)

　　9、保存与Oracle数据库,默认block_size(8k)

　　二、要求：

　　1、对此业务进行优化

　　2、分析数据,说服开发部门实施此优化

　　三、性能分析

　　1、每块记录数

　　8192 * 0.80(1) / 250 = 25.5 (主表)

　　8192 * 0.80 / 2000 = 3.27(详情表)

　　8192 * 0.80 / ( 2000 + 250 ) = 2.91

　　2、访问的逻辑IO(内存块访问)

　　List的查询代价

　　改进后=( 300/25.5 ) * y + 4 + x = 4 + x + 11.8y = 4(2) + 7(3) + 11.8 * 1.5(4) = 28.7

　　改进前=( 300/2.91 ) * y + 4 + x = 4 + x + 103.y = 4 + 7 + 103 * 1.5 = 165.5

　　3、访问涉及到的物理读(磁盘块访问)

　　List的查询代价(逻辑IO * ( 1 C 命中率 ))

　　改进后=28.7 * ( 1 C 0.85(5)) = 4.305

　　改进前=165.5 * ( 1 C 0.85 ) = 24.825

　　4、访问时间(ms)

　　改进前=逻辑IO时间+物理IO时间= 28.7 * 0.01(6) + 4.305 * 7(7) = 30.422ms
　　改进后=逻辑IO时间+物理IO时间= 165.5 * 0.01 + 24.825 * 7 = 175.43ms

上一条：
一些关于数据存储和查询优化的想法
下一条：
MDAC2.8 安装问题与解决方法

0条评论 (评论内容有缓存机制,请悉知!)

最新最热

相关文章
Apifox桌面端被曝遭供应链投毒：CDN 脚本被篡改，窃取 SSH 密钥与 Git 凭证(0个评论)
智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)

近期评论
test1 在
opencode + Oh-my-openagent,我的第一个免费的ai编程智能体管家:Sisyphus中评论 test..
122 在
学历：一种延缓就业设计，生活需求下的权衡之选中评论工作几年后，报名考研了，到现在还没认真学习备考，迷茫中。作为一名北漂互联网打工人..
Zita 在
Google AI Studio升级全栈 vibe coding体验，可直接构建带登录和数据库的应用中评论 111222..
123 在
Clash for Windows作者删库跑路了，github已404中评论按理说只要你在国内，所有的流量进出都在监控范围内，不管你怎么隐藏也没用，想搞你分..
原梓番博客在
在Laravel框架中使用模型Model分表最简单的方法中评论好久好久都没看友情链接申请了，今天刚看，已经添加。..

Top

如何用分表存储来提高性能 推荐

如何用分表存储来提高性能推荐