侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

MongoDB查询性能优化验证及验证

数据库  /  管理员 发布于 5年前   449

结论:

1、 200w数据,合理使用索引的情况下,单个stationId下4w数据。mongodb查询和排序的性能理想,无正则时client可以在600ms+完成查询,qps300+。有正则时client可以在1300ms+完成查询,qps140+。

2、 Mongodb的count性能比较差,非并发情况下client可以在330ms完成查询,在并发情况下则需要1-3s。可以考虑估算总数的方法,http://blog.sina.com.cn/s/blog_56545fd30101442b.html

测试环境:mongodb使用 replica set,1主2从,96G内存,版本2.6.5

Mem消耗(4个200w数据的collection):


空间消耗(测试数据最终选定的collection):


Jvm: -Xms2G -Xmx2G

Ping延迟33ms

查询都使用ReadPreference.secondaryPreferred()

无正则

1、 创建stationId, firmId复合引查询场景(200w集合,12个字段)

查询次数:20000

查询条件:多条件查询10条记录,并逐条获取记录

String key = "清泉" + r.nextInt(1000);Pattern pattern = Pattern.compile(key);BasicDBObject queryObject = new BasicDBObject("stationId",new BasicDBObject("$in", new Integer[]{20})).append("firmId", new BasicDBObject("$gt", 5000)).append("dealCount", new BasicDBObject("$gt", r.nextInt(1000000))); DBCursor cursor = collection.find(queryObject).limit(10).skip(2);

并发:200

耗时:61566

单次耗时(server):124ms

Qps:324.85

2、 创建stationId, firmId复合引查询场景(200w集合,12个字段)

查询次数:20000

查询条件:多条件查询10条记录排序,并逐条获取记录

String key = "清泉" + r.nextInt(100);Pattern pattern = Pattern.compile(key);BasicDBObject queryObject = new BasicDBObject("stationId",new BasicDBObject("$in", new Integer[]{4, 20})).append("firmId", new BasicDBObject("$gt", 5000)).append("dealCount", new BasicDBObject("$gt", r.nextInt(1000000))); DBCursor cursor = collection.find(queryObject).sort(new BasicDBObject("firmId", 1)).limit(10).skip(2);

并发:200

耗时:63187

单次耗时(server):119ms

Qps:316.52

3、 创建stationId, firmId复合引查询场景(200w集合,12个字段)

查询次数:2000

查询条件:多条件查询记录数

String key = "清泉" + r.nextInt(100);Pattern pattern = Pattern.compile(key);BasicDBObject queryObject = new BasicDBObject("stationId",new BasicDBObject("$in", new Integer[]{4, 20})).append("firmId", new BasicDBObject("$gt", 5000)).append("dealCount", new BasicDBObject("$gt", r.nextInt(1000000))); long count = collection.count(queryObject);

并发:200

耗时:21887

单次耗时(client):280ms

Qps:91.38

有正则

4、 创建stationId, firmId复合引查询场景(200w集合,12个字段)

查询次数:20000

查询条件:多条件查询10条记录,并逐条获取记录

String key = "清泉" + r.nextInt(1000);Pattern pattern = Pattern.compile(key);BasicDBObject queryObject = new BasicDBObject("stationId",new BasicDBObject("$in", new Integer[]{20})).append("firmId", new BasicDBObject("$gt", 5000)).append ("dealCount", new BasicDBObject("$gt", r.nextInt(1000000))).append("firmName", pattern);DBCursor cursor = collection.find(queryObject).limit(10).skip(2);

并发:200

耗时:137673

单次耗时(server):225ms

Qps:145.27

5、 创建stationId, firmId复合引查询场景(200w集合,12个字段)

查询次数:20000

查询条件:多条件查询10条记录排序,并逐条获取记录

String key = "清泉" + r.nextInt(1000);Pattern pattern = Pattern.compile(key);BasicDBObject queryObject = new BasicDBObject("stationId",new BasicDBObject("$in", new Integer[]{4, 20})).append("firmId", new BasicDBObject("$gt", 5000)).append ("dealCount", new BasicDBObject("$gt", r.nextInt(1000000))).append("firmName", pattern);DBCursor cursor = collection.find(queryObject).sort(new BasicDBObject("firmId", 1)).limit(10).skip(2);

并发:200

耗时:138673

单次耗时(server):230ms

Qps:144.22

6、 创建stationId, firmId复合引查询场景(200w集合,12个字段)

查询次数:2000

查询条件:多条件查询记录数

String key = "清泉" + r.nextInt(1000);Pattern pattern = Pattern.compile(key);BasicDBObject queryObject = new BasicDBObject("stationId",new BasicDBObject("$in", new Integer[]{4, 20})).append("firmId", new BasicDBObject("$gt", 5000)).append ("dealCount", new BasicDBObject("$gt", r.nextInt(1000000))).append("firmName", pattern);long count = collection.count(queryObject);

并发:200

耗时:23155

单次耗时(client):330ms

Qps:86.37

MongoDB索引特点

1、 复合索引必须命中首字段,否则无法生效。后面的字段可以不按顺序命中。

2、 复合索引字段越多占用空间越大,但对查询性能影响不大(数组索引除外)。

3、 会根据sort字段选择索引,优先级超过复合索引中的非首字段。


4、 命中复合索引的情况下,数据量<10w的情况下,过滤非索引字段,效率也比较高。


5、 全文检索性能比较差,200w数据命中50w的情况下,全文检索需要10+s,正则需要1s。

MongoDB客户端配置,可以提出来做成spring注入,设置最大连接数什么的。

MongoClientOptions options =MongoClientOptions.builder().maxWaitTime(1000 * 60 * 2).connectionsPerHost(500).build();mongoClient = new MongoClient(Arrays.asList(new ServerAddress("10.205.68.57", 8700),new ServerAddress("10.205.68.15", 8700),new ServerAddress("10.205.69.13", 8700)), options);mongoClient.setReadPreference(ReadPreference.secondaryPreferred());

mongoDB调研_结论.docx为最终场景下的测试数据,分为有正则和无正则。

mongoDB调研_remote.docx为测试验证过程中的数据,有可能存在缓存等情况,不一定准确,功参考。

关于MongoDB 查询优化原则的大家了解吗?下文给大家介绍下,具体内容如下所示:

1.在查询条件、排序条件、统计条件的字段上选择创建索引,可以显著提高查询效率。

2.用$or时把匹配最多结果的条件放在最前面,用$and时把匹配最 少 结果的条件放在最前面。

3.使用limit()限定返回结果集的大小,减少数据库服务器的资源消耗,以及网络传输的数据量。

4.尽量少用$in,而是分解成一个一个的单一查询。尤其是在分片上,$in会让你的查询去每一个分片上查一次,如果实在要用的话,先在每个分片上建索引。

5.尽量不用模糊匹配查询,用其它精确匹配查询代替,比如$in、$nin。

6.查询量大、并发大的情况,通过前端加缓存解决。

7.能不用安全模式的操作就不用安全模式,这样客户端没必要等待数据库返回查询结果以及处理异常,快了一个数量级。

8.MongoDB的智能查询优化,判断粒度为query条件,而skip和limit都不在其判断之中,当分页查询最后几页时,先用order反向排序。

9.尽量减少跨分片查询,balance均衡次数少。

10.只查询要使用的字段,而不查询所有字段。

11.更新字段的值时,使用$inc比update效率高。

12.apped collections比普通collections的读写效率高。

13.server-side processing类似于SQL查询的存储过程,可以减少网络通讯的开销。

14.必要时使用hint()强制使用某个索引查询。

15.如果有自己的主键列,则使用自己的主键列作为id,这样可以节约空间,也不需要创建额外的所以。

16.使用explain,根据exlpain plan进行优化。

17.范围查询的时候尽量用$in、$nin代替。

18.查看数据库查询日志,具体分析的效率低的操作。

19.mongodb有一个数据库优化工具database profiler,能够检测数据库操作的性能。可以发现query或者write操作中执行效率低的,从而针对这些操作进行优化。

20.尽量把更多的操作放在客户端,当然这就是mongodb设计的理念之一。


  • 上一条:
    Mongodb索引的优化
    下一条:
    MongoDB性能优化及监控
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 分库分表的目的、优缺点及具体实现方式介绍(0个评论)
    • DevDB - 在 VS 代码中直接访问数据库(0个评论)
    • 在ubuntu系统中实现mysql数据存储目录迁移流程步骤(0个评论)
    • 在mysql中使用存储过程批量新增测试数据流程步骤(0个评论)
    • php+mysql数据库批量根据条件快速更新、连表更新sql实现(0个评论)
    • 近期文章
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • 在go + gin中gorm实现指定搜索/区间搜索分页列表功能接口实例(0个评论)
    • 在go语言中实现IP/CIDR的ip和netmask互转及IP段形式互转及ip是否存在IP/CIDR(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2017-06
    • 2017-08
    • 2017-09
    • 2017-10
    • 2017-11
    • 2018-01
    • 2018-05
    • 2018-10
    • 2018-11
    • 2020-02
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2020-07
    • 2020-08
    • 2020-09
    • 2021-02
    • 2021-04
    • 2021-07
    • 2021-08
    • 2021-11
    • 2021-12
    • 2022-02
    • 2022-03
    • 2022-05
    • 2022-06
    • 2022-07
    • 2022-08
    • 2022-09
    • 2022-10
    • 2022-11
    • 2022-12
    • 2023-01
    • 2023-03
    • 2023-04
    • 2023-05
    • 2023-07
    • 2023-08
    • 2023-10
    • 2023-11
    • 2023-12
    • 2024-01
    • 2024-03
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客