分布式基础(七)容错

 

分布式系统故障发生的概率很大,为了实现高可用以及减少人工运维成本,需要实现自动化容错。

故障检测

通过 **租约机制** 来对故障进行检测。假设节点 A 为主控节点,节点 A 向节点 B 发送租约,节点 B 在租约规定的期限内才能提供服务。期限快到达时,节点 B 需要向 A 重新申请租约。

如果过期,那么 B 不再提供服务,并且 A 也能知道 B 此时可能发生故障并已经停止服务。可以看到,通过这种机制,A 和 B 都能对 B 发生故障这一事实达成一致。

故障恢复

当某个节点故障时,就将它上面的服务迁移到其它节点。

本站所有文章均由网友分享,仅用于参考学习用,请勿直接转载,如有侵权,请联系网站客服删除相关文章。若由于商用引起版权纠纷,一切责任均由使用者承担
极客文库 » 分布式基础(七)容错

Leave a Reply

欢迎加入「极客文库」,成为原创作者从这里开始!

立即加入 了解更多