面试题
如何优化频繁命令往返造成的性能瓶颈?
Redis 是一种基于客户端 - 服务端模型以及请求 / 响应协议的 TCP 服务。一个请求会遵循以下步骤:
-
客户端向服务端发送命令分四步 (发送命令→命令排队→命令执行→返回结果),并监听 Socket 返回,通常以阻塞模式等待服务端响应。
-
服务端处理命令,并将结果返回给客户端。
上述两步称为:Round Trip Time (简称 RTT, 数据包往返于两端的时间)
如果同时需要执行大量的命令,那么就要等待上一条命令应答后再执行,这中间不仅仅多了 RTT(Round Time Trip),而且还频繁调用系统 IO,发送网络请求,同时需要 redis 调用多次 read ()
和 write ()
系统方法,系统方法会将数据从用户态转移到内核态,这样就会对进程上下文有比较大的影响了,性能较差。
管道概述
https://redis.io/docs/manual/pipelining/ (opens in a new tab)
管道(pipeline)可以一次性发送多条命令给服务端,服务端依次处理完完毕后,通过一条响应一次性将结果返回,通过减少客户端与 redis 的通信次数来实现降低往返延时时间。pipeline 实现的原理是队列,先进先出特性就保证数据的顺序性。
Pipeline 是为了解决 RTT 往返回时,仅仅是将命令打包一次发送,对整个 Redis 的执行不造成其他任何影响。批处理命令变种优化措施,类似 Redis 的原生批命令(mget 和 mset)。
使用
root@redis:/data# cat cmd.txt
set k100 v100
set k200 v200
hset k300 name tom
hset k300 age 18
lpush list 1 2 3 4 5
root@redis:/data# cat cmd.txt | redis-cli -a password --pipe
Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe.
All data transferred. Waiting for the last reply...
Last reply received from server.
errors: 0, replies: 5
root@redis:/data#
总结
-
Pipeline 与原生批量命令对比
- 原生批量命令是原子性(例如:mset,mget),pipeline 是非原子性;
- 原生批量命令一次执行执行一种命令,pipeline 支持批量执行不同命令;
- 原生批量命令是服务端实现,而 pipeline 需要服务端与客户端共同完成。
-
Pipeline 与事务对比
- 事务具有原子性,管道不具有原子性;
- 管道一次性将多一条命令发送到服务器,事务是一条一条的发,事务只有在接收到 exec 命令后才会执行,管道不会;
- 执行事务时会阻塞其他命令的执行,而执行管道中的命令时不会。
-
使用 Pipeline 注意事项
- pipeline 缓冲的指令只是会依次执行,不保证原子性,如果执行中指令发生异常,会将继续执行后续的指令;
- 使用 pipeline 组装的命令个数不能太多,不然数据量过大客户端阻塞的时间可能过久,同时服务端此时也被迫回复一个队列答复,占用内存。