1.简介
凌晨2点,你睡得正香,老板就突然打电话过来说,redis服务器炸了,网站瘫痪了!你不得不起床打开电脑开始苦逼的解决问题:重新配置redis,把项目的redis的地址切换到从节点的redis,然后重新打包项目,部署等一系列困扰你睡美梦的操作。然而,如果你配置redis哨兵,这一切将不会发生,你还可以继续睡你的美梦。
1.1sentinel 架构
三个哨兵充当对redis实例的实时监控,如果主节点挂掉,哨兵察觉到后立即在两个从节点中选举新的master,当挂掉的主节点恢复正常后,充当新master的从节点。

2.主从配置
你需要有三个redis实例,一个主节点和两个从节点
关于主从同步的配置可以看我的这篇博客
注意:我的redis是5版本的
redis主从复制
3.sentinel配置
在每一份redis实例上创建一份配置文件,在单机环境中,确保端口唯一即可(其他的配置不需要动)
1 2 3 4 5 6 7 8 9 10
| #启动端口 port 26379 #监控主节点redis 服务名 ip和端口 当两个哨兵觉得主节点不可用时主节点下线 sentinel monitor mymaster 主节点redis的ip 端口 2 #5秒内主节点没有响应认定为挂掉了 sentinel down-after-milliseconds mymaster 5000 #选举另一个master超时时间 sentinel failover-timeout mymaster 60000 #选举中 最多有一个从节点同步主节点 sentinel parallel-syncs mymaster 1
|
ok,现在我们的整个环境搭建,三个redis实例和三个sentinel实例,我是在单机的centos环境下测试,在这里请各位读者十分的注意自己的ip和端口避免弄错! 我这里使用的外网的ip,你可以用内网本地ip即可。
实例 |
ip:port |
redis1 |
192.168.72.134:6379 |
redis2 |
192.168.72.134:6380 |
redis3 |
192.168.72.134:6381 |
sentinel1 |
192.168.72.134:26379 |
sentinel2 |
192.168.72.134:26380 |
sentinel3 |
192.168.72.134:26381 |
我们打开主节点redis实例客户端 查看具体信息
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
| [root@localhost redis-5.0.3]# redis 127.0.0.1:6379> info replication # Replication #角色是master 其他从节点为salve role:master connected_slaves:2 #可以看到下面两个从节点实例 如果你的没有 请务必检查自己的操作步骤 slave0:ip=192.168.72.134,port=6381,state=online,offset=28,lag=1 slave1:ip=192.168.72.134,port=6380,state=online,offset=28,lag=1 master_replid:7387ff36c2ebcf7d1440e07c5cc006c96ae414c3 master_replid2:0000000000000000000000000000000000000000 master_repl_offset:42 second_repl_offset:-1 repl_backlog_active:1 repl_backlog_size:1048576 repl_backlog_first_byte_offset:1 repl_backlog_histlen:42
|
我们启动三个哨兵实例,如下图

启动任一sentinel客户端,查看其信息
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43
| [root@localhost redis-5.0.3]# redis-cli -p 26379 127.0.0.1:26379> sentinel master mymaster 1) "name" 2) "mymaster" 3) "ip" 4) "192.168.72.134" 5) "port" 6) "6379" 7) "runid" 8) "f51aee2ec220f0f662c248542bf9d03c86cc3834" 9) "flags" 10) "master" 11) "link-pending-commands" 12) "0" 13) "link-refcount" 14) "1" 15) "last-ping-sent" 16) "0" 17) "last-ok-ping-reply" 18) "514" 19) "last-ping-reply" 20) "514" 21) "down-after-milliseconds" 22) "5000" 23) "info-refresh" 24) "1239" 25) "role-reported" 26) "master" 27) "role-reported-time" 28) "121624" 29) "config-epoch" 30) "4" 31) "num-slaves" 32) "2" 33) "num-other-sentinels" 34) "2" 35) "quorum" 36) "2" 37) "failover-timeout" 38) "180000" 39) "parallel-syncs" 40) "1"
|
可以看到num-slaves和num-other-sentinels都是2,前者是从节点数量,后者是关联的哨兵数量,如果你的参数异常,请检查你的操作步骤。
3.测试
查看当前的master
显然是我们前面哨兵配置中监听的主节点
1 2 3
| 127.0.0.1:26379> SENTINEL get-master-addr-by-name mymaster 1) "192.168.72.134" 2) "6379"
|
宕机测试:
现在我们关闭redis 6379实例30秒
1
| redis-cli -p 6379 DEBUG sleep 30
|
再查看主节点时发现已经切换6380端口的redis实例
1 2 3
| 127.0.0.1:26379> SENTINEL get-master-addr-by-name mymaster 1) "192.168.72.134" 2) "6380"
|
6379实例恢复时,我们可以看到它变成了从节点
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
| 127.0.0.1:6379> info replication # Replication role:slave master_host:192.168.72.134 master_port:6380 master_link_status:up master_last_io_seconds_ago:0 master_sync_in_progress:0 slave_repl_offset:415421 slave_priority:100 slave_read_only:1 connected_slaves:0 master_replid:c6eba63129405a3f0fe2786b974fa2048179bafd master_replid2:0000000000000000000000000000000000000000 master_repl_offset:415421 second_repl_offset:-1 repl_backlog_active:1 repl_backlog_size:1048576 repl_backlog_first_byte_offset:393523 repl_backlog_histlen:21899
|
4.总结
本次教程就到此结束,请读者严格按照每一步操作来,避免踩坑。
当你再打开redis的配置文件查看最底部时,你会发现其中的主从配置ip和端口已经被sentinel动态的修改,每一次的宕机,sentinel都会对配置文件进行动态的修改。