侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

redis中的数据结构和编码详解

Redis  /  管理员 发布于 7年前   356

redis中的数据结构和编码:

    背景:

  •         1>redis在内部使用redisObject结构体来定义存储的值对象。
  •         2>每种类型都有至少两种内部编码,Redis会根据当前值的类型和长度来决定使用哪种编码实现。
  •         3>编码类型转换在Redis写入数据时自动完成,这个转换过程是不可逆的,转换规则只能从小内存编码向大内存编码转换。

    源码:

        值对象redisObject:

            typedef struct redisObject {
                unsigned type:4;                /* 对象类型 */
                unsigned encoding:4;            /* 内部编码 */
                unsigned lru:LRU_BITS;     /* lru time (relative to server.lruclock) */
                int refcount;                    /* 引用计数器,内存回收机制就是基于该值实现的 */
                void *ptr;                        /* 若要存储的是整数值则直接存储数据,否则表示指向数据的指针 */
            } robj;

        类型type:

            说明:查看当前键的类型:type key

            #define OBJ_STRING 0     /*字符串对象*/
            #define OBJ_LIST 1        /*列表对象*/
            #define OBJ_SET 2        /*集合对象*/
            #define OBJ_ZSET 3        /*有序集合对象*/
            #define OBJ_HASH 4        /*哈希对象*/

        编码encoding;

            说明:查看当前键的编码:object encoding key

            #define OBJ_ENCODING_RAW 0             /*Raw representation 简单动态字符串*/
            #define OBJ_ENCODING_INT 1             /*Encoded as integer long long类型整数*/
            #define OBJ_ENCODING_HT 2            /* Encoded as hash table 字典*/
            #define OBJ_ENCODING_ZIPMAP 3        /* Encoded as zipmap 压缩map*/
            #define OBJ_ENCODING_LINKEDLIST 4     /* Encoded as regular linked list 双端链表*/
            #define OBJ_ENCODING_ZIPLIST 5         /* Encoded as ziplist 压缩列表*/
            #define OBJ_ENCODING_INTSET 6         /* Encoded as intset 整数集合*/
            #define OBJ_ENCODING_SKIPLIST 7     /* Encoded as skiplist 跳跃表*/
            #define OBJ_ENCODING_EMBSTR 8         /* Embedded sds string encoding embstr编码的简单动态字符串*/
            #define OBJ_ENCODING_QUICKLIST 9     /* 基于压缩列表的双端列表实现的 快速表*/

        最后被访问的时间lru:

            概念:记录对象最后一次被访问的时间。
            说明:
                1>查看当前键的空闲时间(该命令不会更新lru字段);object idletime key 。可以通过scan + object idletime key 来收集长时间未被访问的数据,然后手动清理。
                2>当配置了maxmemory和maxmemory-policy=volatile-lru或者allkeys-lru时,若内存超过了上限(maxmemory)后,则优先回收长时间没有被访问的数据,从而回收内存。

        引用计数器refcount:    

            概念:记录当前对象被引用的次数,当refcount=0时,可以安全回收当前对象空间。
            说明:获取当前对象引用:object refcount key

    类型对应的编码:

        字符串:
            int:存放整形值的字符串。
            embstr:存放字符的短字符串(大小不超过44个字节)。
            raw:存放字符的长字符串(大小不超过44个字节)。
           
            embstr和raw的比较:
                raw调用2次内存分配函数,释放时当然也需要释放两次。
                embstr调用1次内存分配函数,分配一块连续的内存,释放时只需释放一次。

        列表(list):

            压缩列表(ziplist):
                结构:所有数据都是采用线性连续的内存结构(大致可类比数组),目的是为了减少内存的占用,追求空间和时间的平衡。
                    1>以O(1)时间复杂度入队和出队。
                    2>读写操作涉及复杂的指针移动,最坏时间复杂度为O(n2),故列表的元素不易太多。
                    3>新增删除操作涉及内存重新分配,加大了操作的复杂性。

                优点:占用内存较少,且占用的是一块连续的内存,故加载的速度相对更快一些。
                缺点:当元素的个数较大时,访问元素的时间较长。

                应用:

                   适合存储小对象和长度有限(即使O(n2)的复杂度也不会太大)的数据。
                    当元素个数小于list-max-ziplist-entries(默认512) 且 所有元素值的大小都小于list-max-ziplist-value(默认64字节)时,使用ziplist作为列表的内部实现。

            双端链表(linkedlist):

                优点:元素的个数较多时,访问元素的时间比压缩列表更快一些。
                缺点:因为是双向链表,故维护了前置指针、后置指针等结构,占用了更多的内存,且内存不是连续的,容易产生内存碎片。
                说明:当无法满足ziplist的条件时,使用linkedlist作为列表的内部实现。
                应用:当列表对象元素较多时,压缩列表就会转化为更适合存储大量元素的双端链表。
               
            注意:只能小内存编码向大内存编码转换。(若当元素增删频繁时,数据向压缩编码转换是非常消耗CPU的,得不偿失)

            快速列表(quicklist):

                结构:一个双向链表,链表的每一个节点都是一个ziplist,故quicklist结合了双向链表和压缩列表的优点。
                Redis3.2开始,列表采用quicklist进行编码。

        哈希(hash):

            压缩列表(ziplist):

                应用:当元素个数小于hash-max-ziplist-entries(默认512) 且 所有元素value的大小都小于hash-max-ziplist-value(默认64字节)时,使用ziplist作为哈希的内部实现。

            哈希表(hashtable):

                优点:读写时间复杂度O(1)
                缺点:占用内存较多。
                应用:当无法满足ziplist的条件时,hashtable作为哈希的内部实现。

            hash算法:与传统hash算法类似,根据key计算得到在哈希表中的位置,采用单链表解决冲突,达到加载因子时进行扩展,进而引发重哈希。

            rehash:采用增量式重哈希:

                概念:在扩容时不会一次性对所有的key进行rehash,而是将key的rehash操作分散延迟到其它操作(哈希表的查找、更新、删除)中。
                优点:避免由于大量的key在同一时间段进行rehash操作导致服务短暂无响应的问题。
                过程:在增量式的rehash过程中,会使用到两张哈希表:
                    查找:先从老表中查找,再从新表中查找,此外还会对一些key进行rehash操作。
                    新增:新增的键值对添加到新表中。

        集合(set):

            整数集合(intset):
                结构:有序、不重复的整数集。
                    1>查找时间复杂度为O(logn)
                    2>插入时间复杂度为O(n)
                优点:占用的内存远小于hashtable,
                应用:当元素都是整数 且 元素个数小于set-max-intset-entries(默认512)时,使用intset作为集合的内部实现。

            哈希表(hashtable):当无法满足intset的条件时,使用hashtable作为集合的内部实现。

        有序集合(zset):

            说明:redis给有序集合中的每个元素设置一个分数(score)作为排序的依据。
           
            压缩列表(ziplist):
                应用:当元素个数小于zset-max-ziplist-entries(默认128个) 且 每个元素的值都小于zset-max-ziplist-value(默认64字节)时,使用ziplist作为有序集合的内部实现。
               
            跳跃表(skiplist):
                结构:跳跃表通过在每个节点中(基于层和跨度等)维持多个指向其它节点的指针来实现快速访问。
                    查找时间复杂度平均O(logn)、最坏O(n)。
                应用:当不满足ziplist条件时,使用skiplist作为内部实现。

    内存优化:

        场景:有海量key和value都比较小的数据,在redis中如何存储才更省内存。
        原理:通过大幅减少key的数量来降低内存的消耗。
        实现:在客户端通过分组将海量的key根据一定的策略映射到一组hash对象中,由于value较小,故hash类型的对象会使用占用内存较小的ziplist编码。
            eg:如存在100万个键,可以映射到1000个hash中,每个hash保存1000个元素。

以上就是redis中的数据结构和编码详解的详细内容,更多关于redis中的数据结构和编码的资料请关注其它相关文章!


  • 上一条:
    Redis Cluster集群数据分片机制原理
    下一条:
    Redis的持久化方案详解
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在Redis中能实现的功能、常见应用介绍(0个评论)
    • 2024年Redis面试题之一(0个评论)
    • 在redis缓存常见出错及解决方案(0个评论)
    • 在redis中三种特殊数据类型:地理位置、基数(cardinality)估计、位图(Bitmap)使用场景介绍浅析(2个评论)
    • Redis 删除 key用 del 和 unlink 有啥区别?(1个评论)
    • 近期文章
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • 在go + gin中gorm实现指定搜索/区间搜索分页列表功能接口实例(0个评论)
    • 在go语言中实现IP/CIDR的ip和netmask互转及IP段形式互转及ip是否存在IP/CIDR(0个评论)
    • PHP 8.4 Alpha 1现已发布!(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2017-12
    • 2020-03
    • 2020-05
    • 2021-04
    • 2022-03
    • 2022-05
    • 2022-08
    • 2023-02
    • 2023-04
    • 2023-07
    • 2024-01
    • 2024-02
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客