1、
zookeeper
宕机与
dubbo
直连
现象:
zookeeper
注册中心宕机,还可以消费
dubbo
暴露的服务。
原因:注册中心全部宕掉后,服务提供者和服务消费者仍能通过本地缓存通讯
zookeeper
的健壮性:
-
监控中心宕掉不影响使用,只是丢失部分采样数据
-
数据库宕掉后,注册中心仍能通过缓存提供服务列表查询,但不能注册新服务
-
注册中心对等集群,任意一台宕掉后,将自动切换到另一台
-
注册中心全部宕掉后,服务提供者和服务消费者仍能通过本地缓存通讯
-
服务提供者无状态,任意一台宕掉后,不影响使用
-
服务提供者全部宕掉后,服务消费者应用将无法使用,并无限次重连等待服务提供者恢复
高可用:通过设计,减少系统不能提供服务的时间;
2、集群下
dubbo
负载均衡配置
在集群负载均衡时,
Dubbo
提供了多种均衡策略,缺省为
random
随机调用。
负载均衡策略:
-
(1)
Random LoadBalance
随机,按权重设置随机概率。
在一个截面上碰撞的概率高,但调用量越大分布越均匀,而且按概率使用权重后也比较均匀,有利于动态调整提供者权重。
-
(2)
RoundRobin LoadBalance
轮循,按公约后的权重设置轮循比率。
存在慢的提供者累积请求的问题,比如:第二台机器很慢,但没挂,当请求调到第二台时就卡在那,久而久之,所有请求都卡在调到第二台上。
-
(3)
LeastActive LoadBalance
最少活跃调用数,相同活跃数的随机,活跃数指调用前后计数差。
使慢的提供者收到更少请求,因为越慢的提供者的调用前后计数差会越大。
-
(4)
ConsistentHash LoadBalance
一致性
Hash
,相同参数的请求总是发到同一提供者。
当某一台提供者挂时,原本发往该提供者的请求,基于虚拟节点,平摊到其它提供者,不会引起剧烈变动。
缺省只对第一个参数
Hash
,如果要修改,请配置:
<dubbo:parameter key=\"hash.arguments\" value=\"0,1\" />
缺省用
160
份虚拟节点,如果要修改,请配置:
<dubbo:parameter key=\"hash.nodes\" value=\"320\" />
3、整合
hystrix
,服务熔断与降级处理
3.1、服务降级
什么是服务降级?
当服务器压力剧增的情况下,根据实际业务情况及流量,对一些服务和页面有策略的不处理或换种简单的方式处理,从而释放服务器资源以保证核心交易正常运作或高效运作。
对于服务熔断和降级,解决这两个问题所支持的框架可不少,
Hystrix
当属其中的佼佼者。
先说说熔断器的设计思路,下图简明扼要的给出了好的熔断器实现的三个状态机:
-
Closed
:熔断器关闭状态,调用失败次数积累,到了阈值(或一定比例)则启动熔断机制;
-
Open
:熔断器打开状态,此时对下游的调用都内部直接返回错误,不走网络,但设计了一个时钟选项,默认的时钟达到了一定时间(这个时间一般设置成平均故障处理时间,也就是
MTTR
),到了这个时间,进入半熔断状态;
-
Half-Open
:半熔断状态,允许定量的服务请求,如果调用都成功(或一定比例)则认为恢复了,关闭熔断器,否则认为还没好,又回到熔断器打开状态;
可以通过服务降级功能临时屏蔽某个出错的非关键服务,并定义降级后的返回策略。
向注册中心写入动态配置覆盖规则:
RegistryFactory registryFactory = ExtensionLoader.getExtensionLoader(RegistryFactory.class).getAdaptiveExtension();Registry registry = registryFactory.getRegistry(URL.valueOf(\"zookeeper://10.20.153.10:2181\"));registry.register(URL.valueOf(\"override://0.0.0.0/com.foo.BarService?category=configurators&dynamic=false&application=foo&mock=force:return+null\"));
其中:
-
mock=force:return+null
表示消费方对该服务的方法调用都直接返回
null
值,不发起远程调用。用来屏蔽不重要服务不可用时对调用方的影响。
-
还可以改为
mock=fail:return+null
表示消费方对该服务的方法调用在失败后,再返回
null
值,不抛异常。用来容忍不重要服务不稳定时对调用方的影响。
3.2、集群容错
在集群调用失败时,
Dubbo
提供了多种容错方案,缺省为
failover
重试。
集群容错模式
-
Failover Cluster
失败自动切换,当出现失败,重试其它服务器。通常用于读操作,但重试会带来更长延迟。可通过 retries=“2” 来设置重试次数(不含第一次)。
重试次数配置如下:
<dubbo:service retries=\"2\" />
或
<dubbo:reference retries=\"2\" />
或
dubbo:reference><dubbo:method name=\"findFoo\" retries=\"2\" /></dubbo:reference
-
Failfast Cluster
快速失败,只发起一次调用,失败立即报错。通常用于非幂等性的写操作,比如新增记录。
-
Failsafe Cluster
失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。
-
Failback Cluster
失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。
-
Forking Cluster
并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更多服务资源。可通过 forks=“2” 来设置最大并行数。
-
Broadcast Cluster
广播调用所有提供者,逐个调用,任意一台报错则报错 [2]。通常用于通知所有提供者更新缓存或日志等本地资源信息。
集群模式配置
按照以下示例在服务提供方和消费方配置集群模式
<dubbo:service cluster=\"failsafe\" />
或
<dubbo:reference cluster=\"failsafe\" />
3.3、整合
hystrix
Hystrix
旨在通过控制那些访问远程系统、服务和第三方库的节点,从而对延迟和故障提供更强大的容错能力。
Hystrix
具备拥有回退机制和断路器功能的线程和信号隔离,请求缓存和请求打包,以及监控和配置等功能
(1)配置
spring-cloud-starter-netflix-hystrix
spring boot
官方提供了对
hystrix
的集成,直接在
pom.xml
里加入依赖:
<dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-netflix-hystrix</artifactId><version>1.4.4.RELEASE</version></dependency>
然后在
Application
类上增加
@EnableHystrix
来启用
hystrix starter
:
@SpringBootApplication@EnableHystrixpublic class ProviderApplication {}
(2)配置
Provider
端
在
Dubbo
的
Provider
上增加
@HystrixCommand
配置,这样子调用就会经过
Hystrix
代理。
@Service(version = \"1.0.0\")public class HelloServiceImpl implements HelloService {@HystrixCommand(commandProperties = {@HystrixProperty(name = \"circuitBreaker.requestVolumeThreshold\", value = \"10\"),@HystrixProperty(name = \"execution.isolation.thread.timeoutInMilliseconds\", value = \"2000\") })@Overridepublic String sayHello(String name) {// System.out.println(\"async provider received: \" + name);// return \"annotation: hello, \" + name;throw new RuntimeException(\"Exception to show hystrix enabled.\");}}
(3)配置
Consumer
端
对于
Consumer
端,则可以增加一层
method
调用,并在
method
上配置
@HystrixCommand
。当调用出错时,会走到
fallbackMethod = \"reliable\"
的调用里。
@Reference(version = \"1.0.0\")private HelloService demoService;@HystrixCommand(fallbackMethod = \"reliable\")public String doSayHello(String name) {return demoService.sayHello(name);}public String reliable(String name) {return \"hystrix fallback value\";}