Redis常考面试题

前段时间学习了一下redis,并且也做了些学习笔记,刚过一周的时候,就已经忘得一干二净,实在是惭愧啊。不过唯一的安慰就是当时的笔记灵感都记录下来了,尤其是难点都做了详细的笔记。本来准备过段时间再回顾一下,今天同事丢了本redis面试题给我,大概看了下,基本上前段时间看的内容都有提到,所以就准备将这些面试题和我之前做的笔记结合起来做一个回忆索引。

什么是Redis?

Redis是完全开源免费的,遵守 BSD 协议,是一个高性能的key-value数据库。 Redis与其他key-value缓存产品有以下三个特点:
1. Redis 支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次 加载进行使用。
2. Redis 不仅仅支持简单的 key-value 类型的数据,同时还提供 list,set,zset, hash 等数据结构的存储。
3. Redis 支持数据的备份,即 master-slave 模式的数据备份。

Redis优势

  1. 性能极高 – Redis 能读的速度是 110000 次/s,写的速度是 81000 次/s 。
  2. 丰富的数据类型 – Redis 支持二进制案例的 Strings, Lists, Hashes, Sets 及Ordered Sets 数据类型操作。
  3. 原子 – Redis 的所有操作都是原子性的,意思就是要么成功执行要么失败完全不执 行。单个操作是原子性的。多个操作也支持事务,即原子性,通过 MULTI 和 EXEC指令包 起来。
  4. 丰富的特性 – Redis 还支持 publish/subscribe, 通知, key 过期等等特性。

Redis的数据类型?

答:Redis支持五种数据类型:string(字符串),hash(哈希),list(列表),set(集 合)及 zsetsorted set:有序集合)。
我们实际项目中比较常用的是string,hash如果你是Redis中高级用户,还需要加上下面几种数据结构 HyperLogLog、Geo、Pub/Sub。如果你说还玩过Redis Module,像 BloomFilter,RedisSearch,Redis-ML,面试官得眼睛就开始发亮了。

使用 Redis 有哪些好处?

  1. 速度快,因为数据存在内存中,类似于 HashMap,HashMap 的优势就是查找和操 作的时间复杂度都是 O1)
  2. 支持丰富数据类型,支持 string,list,set,Zset,hash 等
  3. 支持事务,操作都是原子性,所谓的原子性就是对数据的更改要么全部执行,要么全部不执行
  4. 丰富的特性:可用于缓存,消息,按 key 设置过期时间,过期后将会自动删除

Redis相比Memcached有哪些优势?

  1. Memcached所有的值均是简单的字符串,redis作为其替代者,支持更为丰富的数据类型
  2. Redis的速度比Memcached快很多
  3. Redis可以持久化其数据

Memcache与Redis的区别都有哪些?

  1. 存储方式Memecache把数据全部存在内存之中,断电后会挂掉,数据不能超过内存大小。 Redis有部份存在硬盘上,这样能保证数据的持久性。
  2. 数据支持类型Memcache对数据类型支持相对简单。Redis有复杂的数据类型。
  3. 使用底层模型不同它们之间底层实现方式以及与客户端之间通信的应用协议不一 样。 Redis 直接自己构建了VM机制,因为一般的系统调用系统函数的话,会浪费一定的时间去移动和请求。

Redis是单进程单线程的?

答:Redis是单进程单线程的,redis利用队列技术将并发访问变为串行访问,消除了传统数据库串行控制的开销。

一个字符串类型的值能存储最容量是多少?

答:512M

Redis 的持久化机制是什么?各自的优缺点?

  1. RDB(Redis DataBase)持久化方式: 是指用数据集快照的方式半持久化模式)记录 redis 数据库的所有键值对,在某个时间点将数 据写入一个临时文件,持久化结束后,用这个临时文件替换上次持久化的文件,达到数据 恢复。
    优点:

    1. 只有一个文件 dump.rdb,方便持久化。
    2. 容灾性好,一个文件可以保存到安全的磁盘。
    3. 性能最大化,fork 子进程来完成写操作,让主进程继续处理命令,所以是 IO最大 化。使用单独子进程来进行持久化,主进程不会进行任何 IO 操作,保证了 redis的高性能)
    4. 相对于数据集大时,比 AOF 的启动效率更高。
      缺点
    5. 数据安全性低。RDB 是间隔一段时间进行持久化,如果持久化之间 redis 发生故障,会发 生数据丢失。所以这种方式更适合数据要求不严谨的时候
  2. AOF(Append-only file)持久化方式: 是指所有的命令行记录以 redis 命令请求协议的格式完全持久化存储)保存为 aof 文件。
    优点

    1. 数据安全,aof 持久化可以配置 appendfsync 属性,有 always,每进行一次命令操 作就记录到 aof 文件中一次。
    2. 通过 append 模式写文件,即使中途服务器宕机,可以通过 redis-check-aof工具解 决数据一致性问题。
    3. 通过 append 模式写文件,即使中途服务器宕机,可以通过 redis-check-aof工具解 决数据一致性问题。
      缺点
    4. AOF 文件比 RDB 文件大,且恢复速度慢。
    5. 数据集大的时候,比 rdb 启动效率低。

Redis 常见性能问题和解决方案

  1. Master 最好不要写内存快照,如果 Master 写内存快照,save 命令调度 rdbSave函 数,会阻塞主线程的工作,当快照比较大时对性能影响是非常大的,会间断性暂停服务
  2. 如果数据比较重要,某个 Slave 开启 AOF 备份数据,策略设置为每秒同步一
  3. 为了主从复制的速度和连接的稳定性,Master 和 Slave 最好在同一个局域网
  4. 尽量避免在压力很大的主库上增加从
  5. 主从复制不要用图状结构,用单向链表结构更为稳定,即:Master <- Slave1<- Slave2 <- Slave3...这样的结构方便解决单点故障问题,实现 Slave 对 Master的替换。如 果 Master 挂了,可以立刻启用 Slave1 做 Master,其他不变。

redis 过期键的删除策略?

  1. 定时删除:在设置键的过期时间的同时,创建一个定时器 timer). 让定时器在键的过期 时间来临时,立即执行对键的删除操作。
  2. 惰性删除:放任键过期不管,但是每次从键空间中获取键时,都检查取得的键是否过 期,如果过期的话,就删除该键;如果没有过期,就返回该键。
  3. 定期删除:每隔一段时间程序就对数据库进行一次检查,删除里面的过期键。至于要 删除多少过期键,以及要检查多少个数据库,则由算法决定。

Redis 的回收策略(淘汰策略)?

  • volatile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的 数据淘汰
  • volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据 淘汰
  • volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘 汰
  • allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰
  • allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰
  • no-enviction(驱逐):禁止驱逐数据

注意这里的 6 种机制,volatile 和 allkeys 规定了是对已设置过期时间的数据集淘汰数据还 是从全部数据集淘汰数据,后面的 lru、ttl 以及 random 是三种不同的淘汰策略,再加上 一种 no-enviction 永不回收的策略。
使用策略规则:

  1. 如果数据呈现幂律分布,也就是一部分数据访问频率高,一部分数据访问频率低,则 使用 allkeys-lru
  2. 如果数据呈现平等分布,也就是所有的数据访问频率都相同,则使用allkeys- random

为什么 Redis 需要把所有数据放 到内存中?

答 :Redis 为了达到最快的读写速度将数据都读到内存中,并通过异步的方式将数据写入 磁盘。所以 redis 具有快速和数据持久化的特征。如果不将数据放在内存中,磁盘 I/O 速 度为严重影响 redis 的性能。在内存越来越便宜的今天,redis 将会越来越受欢迎。如果设 置了最大使用的内存,则数据已有记录数达到内存限值后不能继续插入新值。

Redis 的同步机制了解么?

答:Redis 可以使用主从同步,从从同步。第一次同步时,主节点做一次 bgsave,并同时 将后续修改操作记录到内存 buffer,待完成后将 rdb 文件全量同步到复制节点,复制节点 接受完成后将 rdb 镜像加载到内存。加载完成后,再通知主节点将期间修改的操作记录同 步到复制节点进行重放就完成了同步过程。

Pipeline 有什么好处,为什么 要用 pipeline?

答:可以将多次 IO 往返的时间缩减为一次,前提是 pipeline 执行的指令之间没有因果相 关性。使用 redis-benchmark 进行压测的时候可以发现影响 redis 的 QPS峰值的一个重 要因素是 pipeline 批次指令的数目。

是否使用过 Redis 集群,集群 的原理是什么?

  1. Redis Sentinal 着眼于高可用,在 master 宕机时会自动将 slave 提升为master,继 续提供服务。
  2. Redis Cluster 着眼于扩展性,在单个 redis 内存不足时,使用 Cluster 进行分片存 储。

Redis 集群方案什么情况下会导 致整个集群不可用?

答:有 A,B,C 三个节点的集群,在没有复制模型的情况下,如果节点 B 失败了,那么整个 集群就会以为缺少 5501-11000 这个范围的槽而不可用。

Redis 支持的 Java 客户端都有 哪些?官方推荐用哪个?

答:Redisson、Jedis、lettuce 等等,官方推荐使用 Redisson。

Jedis 与 Redisson 对比有什么 优缺点?

答:Jedis 是 Redis 的 Java 实现的客户端,其 API 提供了比较全面的 Redis 命令的支 持;Redisson 实现了分布式和可扩展的 Java 数据结构,和 Jedis 相比,功能较为简单, 不支持字符串操作,不支持排序、事务、管道、分区等 Redis 特性。
Redisson 的宗旨是促进使用者对 Redis 的关注分离,从而让使用者能够将精力更集中地放 在处理业务逻辑上。

Redis 如何设置密码及验证密 码?

设置密码:config set requirepass 123456
授权密码:auth 123456

说说 Redis 哈希槽的概念?

答:Redis 集群没有使用一致性 hash,而是引入了哈希槽的概念,Redis 集群有16384 个哈 希槽,每个 key 通过 CRC16 校验后对 16384 取模来决定放置哪个槽,集群的每个节点负 责一部分 hash 槽。

Redis 集群的主从复制模型是怎 样的?

答:为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用,所以集群使用了主从复制模型,每个节点都会有 N-1 个复制品.

Redis 集群会有写操作丢失吗? 为什么?

答 :Redis 并不能保证数据的强一致性,这意味这在实际中集群在特定的条件下可能会丢 失写操作。

Redis 集群之间是如何复制的?

答:异步复制

关于复制这块要讲的内容实在是太多了,而且复制是整个集群模式的基石,没有复制可以说不管是哨兵还是Cluster都是鸡肋。复制在不同的redis版本中实现是不一样的,主要分为全量复制和部分复制,具体的讲解可以移步这篇文章

Redis 集群最大节点个数是多 少?

答:16384 个。

Redis 集群如何选择数据库?

答:Redis 集群目前无法做数据库选择,默认在 0 数据库。

怎么理解 Redis 事务?

答:

  1. 事务是一个单独的隔离操作:事务中的所有命令都会序列化、按顺序地执行。事务在 执行的过程中,不会被其他客户端发送来的命令请求所打断。
  2. 事务是一个原子操作:事务中的命令要么全部被执行,要么全部都不执行。

Redis 事务相关的命令有哪几 个?

答:MULTI、EXEC、DISCARD、WATCH

Redis 如何做内存优化?

答:尽可能使用散列表(hashes),散列表(是说散列表里面存储的数少)使用的内存非 常小,所以你应该尽可能的将你的数据模型抽象到一个散列表里面。比如你的 web 系统中 有一个用户对象,不要为这个用户的名称,姓氏,邮箱,密码设置单独的 key,而是应该把 这个用户的所有信息存储到一张散列表里面。

Redis 最适合的场景?

  1. 会话缓存(Session Cache)
    最常用的一种使用 Redis 的情景是会话缓存(session cache)。用 Redis 缓存会话比其 他存储(如 Memcached)的优势在于:Redis 提供持久化。当维护一个不是严格要求一 致性的缓存时,如果用户的购物车信息全部丢失,大部分人都会不高兴的,现在,他们还 会这样吗? 幸运的是,随着 Redis 这些年的改进,很容易找到怎么恰当的使用 Redis 来缓 存会话的文档。甚至广为人知的商业平台Magento 也提供 Redis 的插件。

  2. 全页缓存(FPC)
    除基本的会话 token 之外,Redis 还提供很简便的 FPC 平台。回到一致性问题,即使重启 了 Redis 实例,因为有磁盘的持久化,用户也不会看到页面加载速度的下降,这是一个极 大改进,类似 PHP 本地 FPC。 再次以 Magento 为例,Magento提供一个插件来使用 Redis 作为全页缓存后端。 此外,对 WordPress 的用户来说,Pantheon 有一个非常好 的插件 wp-redis,这个插件能帮助你以最快速度加载你曾浏览过的页面。

  3. 队列
    Reids 在内存存储引擎领域的一大优点是提供 list 和 set 操作,这使得 Redis能作为一个很 好的消息队列平台来使用。Redis 作为队列使用的操作,就类似于本地程序语言(如 Python)对 list 的 push/pop 操作。 如果你快速的在 Google中搜索“Redis queues”,你马上就能找到大量的开源项目,这些项目的目的就是利用 Redis 创建非常好 的后端工具,以满足各种队列需求。例如,Celery 有一个后台就是使用 Redis 作为 broker,你可以从这里去查看。

  4. 排行榜/计数器
    Redis 在内存中对数字进行递增或递减的操作实现的非常好。集合(Set)和有序集合 (Sorted Set)也使得我们在执行这些操作的时候变的非常简单,Redis 只是正好提供了 这两种数据结构。所以,我们要从排序集合中获取到排名最靠前的 10个用户–我们称之 为“user_scores”,我们只需要像下面一样执行即可: 当然,这是假定你是根据你用户的 分数做递增的排序。如果你想返回用户及用户的分数,你需要这样执行: ZRANGE user_scores 0 10 WITHSCORES Agora Games 就是一个很好的例子,用 Ruby 实现的, 它的排行榜就是使用 Redis 来存储数据的,你可以在这里看到。

  5. 发布/订阅
    最后(但肯定不是最不重要的)是 Redis 的发布/订阅功能。发布/订阅的使用场景确实非 常多。我已看见人们在社交网络连接中使用,还可作为基于发布/订阅的脚本触发器,甚至 用 Redis 的发布/订阅功能来建立聊天系统!

假如 Redis 里面有 1 亿个 key,其中有 10w 个 key 是以某个 固定的已知的前缀开头的,如果将它 们全部找出来?

答:使用 keys 指令可以扫出指定模式的 key 列表。
对方接着追问:如果这个 redis 正在给线上的业务提供服务,那使用 keys 指令会有什么问 题?
这个时候你要回答redis关键的一个特性:redis 的单线程的。keys 指令会导致线程阻塞 一段时间,线上服务会停顿,直到指令执行完毕,服务才能恢复。这个时候可以使用 scan 指令,scan 指令可以无阻塞的提取出指定模式的 key 列表,但是会有一定的重复概率,在 客户端做一次去重就可以了,但是整体所花费的时间会比直接用 keys 指令长。

如果有大量的 key 需要设置同 一时间过期,一般需要注意什么?

答:如果大量的key过期时间设置的过于集中,到过期的那个时间点,redis可能会出现短暂的卡顿现象。一般需要在时间上加一个随机值,使得过期时间分散一些。

使用过 Redis 做异步队列么, 你是怎么用的?

答:一般使用list结构作为队列,rpush 生产消息lpop消费消息。当lpop没有消息的时候,要适当sleep一会再重试。如果对方追问可不可以不用sleep呢?list还有个指令叫blpop,在没有消息的时候,它会阻塞住直到消息到来。如果对方追问能不能生产一次消费多次呢?使用 pub/sub 主题订阅者模式,可以实现1:N 的消息队列。
如果对方追问pub/sub有什么缺点? 在消费者下线的情况下,生产的消息会丢失,得使用专业的消息队列如 RabbitMQ等。 如果对方追问 redis 如何实现延时队列?
我估计现在你很想把面试官一棒打死如果你手上有一根棒球棍的话,怎么问的这么详细。 但是你很克制,然后神态自若的回答道:使用 sortedset,拿时间戳作为score,消息内容作为 key调用zadd来生产消息,消费者用zrangebyscore指令获取N秒之前的数据轮询进行处理。到这里,面试官暗地里已经对你竖起了大拇指。但是他不知道的是此刻你却 竖起了中指,在椅子背后。

使用过 Redis 分布式锁么,它 是什么回事?

先拿setnx来争抢锁,抢到之后,再用expire给锁加一个过期时间防止锁忘记了释放。
这时候对方会告诉你说你回答得不错,然后接着问如果在setnx之后执行expire之前进程意外crash或者要重启维护了,那会怎么样?这时候你要给予惊讶的反馈:唉,是喔,这个锁就永远得不到释放了。紧接着你需要抓一抓自己得脑袋,故作思考片刻,好像接下来的结果是你主动思考出来的,然后回答:我记得set指令有非常复杂的参数,这个应该是可以同时把setnx和expire合成一条指令来用的!对方这时会显露笑容,心里开始默念: 摁,这小子还不错。