侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

基于Morphia实现MongoDB按小时、按天聚合操作方法

数据库  /  管理员 发布于 5年前   197

MongoDB按照天数或小时聚合

需求

最近接到需求,需要对用户账户下的设备状态,分别按照天以及小时进行聚合,以此为基础绘制设备状态趋势图.
实现思路是启动定时任务,对各用户的设备状态数据分别按照小时以及天进行聚合,并存储进数据库中供用户后续查询.
涉及到的技术栈分别为:Spring Boot,MongoDB,Morphia.

数据模型

@Data@Builder@Entity(value = "rawDevStatus", noClassnameStored = true)// 设备状态索引@Indexes({    // 设置数据超时时间(TTL,MongoDB根据TTL在后台进行数据删除操作)    @Index(fields = @Field("time"), options = @IndexOptions(expireAfterSeconds = 3600 * 24 * 72)),    @Index(fields = {@Field("userId"), @Field(value = "time", type = IndexType.DESC)})})public class RawDevStatus {  @Id  @JsonProperty(access = JsonProperty.Access.WRITE_ONLY)  private ObjectId objectId;  private String userId;  private Instant time;  @Embedded("points")  List<Point> protocolPoints;  @Data  @AllArgsConstructor  public static class Point {    /**     * 协议类型     */    private Protocol protocol;    /**     * 设备总数     */    private Integer total;    /**     * 设备在线数目     */    private Integer onlineNum;    /**     * 处于启用状态设备数目     */    private Integer enableNum;  }}

上述代码是设备状态实体类,其中设备状态数据是按照设备所属协议进行区分的.

@Data@Builder@Entity(value = "aggregationDevStatus", noClassnameStored = true)@Indexes({    @Index(fields = @Field("expireAt"), options = @IndexOptions(expireAfterSeconds = 0)),    @Index(fields = {@Field("userId"), @Field(value = "time", type = IndexType.DESC)})})public class AggregationDevStatus {  @Id  @JsonProperty(access = JsonProperty.Access.WRITE_ONLY)  private ObjectId objectId;  /**   * 用户ID   */  private String userId;  /**   * 设备总数   */  private Double total;  /**   * 设备在线数目   */  private Double onlineNum;  /**   * 处于启用状态设备数目   */  private Double enableNum;  /**   * 聚合类型(按照小时还是按照天聚合)   */  @Property("aggDuration")  private AggregationDuration aggregationDuration;  private Instant time;  /**   * 动态设置文档过期时间   */  private Instant expireAt;}

上述代码是期待的聚合结果,其中构建两个索引:(1)超时索引;(2)复合索引,程序会根据用户名以及时间查询设备状态聚合结果.

聚合操作符介绍

聚合操作类似于管道,管道中的每一步操作产生的中间结果作为下一步的输入源,最终输出聚合结果.

此次聚合主要涉及以下操作:

•$project:指定输出文档中的字段.
•$unwind:拆分数据中的数组;
•match:选择要处理的文档数据;
•group:根据key分组聚合结果.

原始聚合语句

db.getCollection('raw_dev_status').aggregate([  {$match:    {      time:{$gte: ISODate("2019-06-27T00:00:00Z")},    }  },  {$unwind: "$points"},  {$project:    {      userId:1,points:1,      tmp: {$dateToString: { format: "%Y:%m:%dT%H:00:00Z", date: "$time" } }    }  },  {$project:    {      userId:1,points:1,      groupTime: {$dateFromString: { dateString: "$tmp", format: "%Y:%m:%dT%H:%M:%SZ", } }    }  },  {$group:    {      _id:{user_id:'$userId', cal_time:'$groupTime'},      devTotal:{'$avg':'$points.total'},      onlineTotal:{'$avg':'$points.onlineNum'},      enableTotal:{'$avg':'$points.enableNum'}    }  },])

上述代码是按小时聚合数据,以下来逐步介绍处理思路:

(1) $match

根据小时聚合数据,因为只需要获取近24小时的聚合结果,所以对数据进行初步筛选.

(2) $unwind

raw_dev_status中的设备状态是按照协议区分的数组,因此需要对其进行展开,以便下一步进行筛选;

(3) $project

  {$project:    {      userId:1,points:1,      tmp: {$dateToString: { format: "%Y:%m:%dT%H:00:00Z", date: "$time" } }    }  }

选择需要输出的数据,分别为:userId,points以及tmp.

需要注意,为了按照时间聚合,对$time属性进行操作,提取%Y:%m:%dT%H时信息至$tmp作为下一步的聚合依据.

如果需要按天聚合,则format数据可修改为:%Y:%m:%dT00:00:00Z即可满足要求.

(4) $project

  {$project:    {      userId:1,points:1,      groupTime: {$dateFromString: { dateString: "$tmp", format: "%Y:%m:%dT%H:%M:%SZ", } }    }  }

因为上一步project操作中,tmp为字符串数据,最终的聚合结果需要时间戳(主要懒,不想在程序中进行转换操作).
因此,此处对$tmp进行操作,转换为时间类型数据,即groupTime.

(5) $group

对聚合结果进行分类操作,并生成最终输出结果.

 {$group:    {      # 根据_id进行分组操作,依据是`user_id`以及`$groupTime`      _id:{user_id:'$userId', cal_time:'$groupTime'},      # 求设备总数平均值      devTotal:{'$avg':'$points.total'},      # 求设备在线数平均值      onlineTotal:{'$avg':'$points.onlineNum'},      # ...      enableTotal:{'$avg':'$points.enableNum'}    }  }

代码编写

此处ODM选择Morphia,亦可以使用MongoTemplate,原理类似.

 /**   * 创建聚合条件   *   * @param pastTime   过去时间段   * @param dateToString 格式化字符串(%Y:%m:%dT%H:00:00Z或%Y:%m:%dT00:00:00Z)   * @return 聚合条件   */  private AggregationPipeline createAggregationPipeline(Instant pastTime, String dateToString, String stringToDate) {    Query<RawDevStatus> query = datastore.createQuery(RawDevStatus.class);    return datastore.createAggregation(RawDevStatus.class)        .match(query.field("time").greaterThanOrEq(pastTime))        .unwind("points", new UnwindOptions().preserveNullAndEmptyArrays(false))        .match(query.field("points.protocol").equal("ALL"))        .project(Projection.projection("userId"),Projection.projection("points"),Projection.projection("convertTime",    Projection.expression("$dateToString",        new BasicDBObject("format", dateToString).append("date", "$time")))        )        .project(Projection.projection("userId"),Projection.projection("points"),Projection.projection("convertTime",    Projection.expression("$dateFromString",        new BasicDBObject("format", stringToDate).append("dateString", "$convertTime")))        )        .group(Group.id(Group.grouping("userId"), Group.grouping("convertTime")),Group.grouping("total", Group.average("points.total")),Group.grouping("onlineNum", Group.average("points.onlineNum")),Group.grouping("enableNum", Group.average("points.enableNum"))        );  }  /**   * 获取聚合结果   *   * @param pipeline 聚合条件   * @return 聚合结果   */  private List<AggregationMidDevStatus> getAggregationResult(AggregationPipeline pipeline) {    List<AggregationMidDevStatus> statuses = new ArrayList<>();    Iterator<AggregationMidDevStatus> resultIterator = pipeline.aggregate(        AggregationMidDevStatus.class, AggregationOptions.builder().allowDiskUse(true).build());    while (resultIterator.hasNext()) {      statuses.add(resultIterator.next());    }    return statuses;  }  //......................................................................................  // 获取聚合结果(省略若干代码)  AggregationPipeline pipeline = createAggregationPipeline(pastTime, dateToString, stringToDate);  List<AggregationMidDevStatus> midStatuses = getAggregationResult(pipeline);  if (CollectionUtils.isEmpty(midStatuses)) {    log.warn("Can not get dev status aggregation result.");    return;  }

总结

以上所述是小编给大家介绍的基于Morphia实现MongoDB按小时、按天聚合操作方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!


  • 上一条:
    MongoDB中的定时索引示例详解
    下一条:
    Mongodb的oplog详解
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 分库分表的目的、优缺点及具体实现方式介绍(0个评论)
    • DevDB - 在 VS 代码中直接访问数据库(0个评论)
    • 在ubuntu系统中实现mysql数据存储目录迁移流程步骤(0个评论)
    • 在mysql中使用存储过程批量新增测试数据流程步骤(0个评论)
    • php+mysql数据库批量根据条件快速更新、连表更新sql实现(0个评论)
    • 近期文章
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • 在go + gin中gorm实现指定搜索/区间搜索分页列表功能接口实例(0个评论)
    • 在go语言中实现IP/CIDR的ip和netmask互转及IP段形式互转及ip是否存在IP/CIDR(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2017-06
    • 2017-08
    • 2017-09
    • 2017-10
    • 2017-11
    • 2018-01
    • 2018-05
    • 2018-10
    • 2018-11
    • 2020-02
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2020-07
    • 2020-08
    • 2020-09
    • 2021-02
    • 2021-04
    • 2021-07
    • 2021-08
    • 2021-11
    • 2021-12
    • 2022-02
    • 2022-03
    • 2022-05
    • 2022-06
    • 2022-07
    • 2022-08
    • 2022-09
    • 2022-10
    • 2022-11
    • 2022-12
    • 2023-01
    • 2023-03
    • 2023-04
    • 2023-05
    • 2023-07
    • 2023-08
    • 2023-10
    • 2023-11
    • 2023-12
    • 2024-01
    • 2024-03
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客