服务发现的工作方式、基本使用方法与配置细节

Dubbo 服务发现的工作方式、基本使用方法与配置细节,涵盖延迟注册、优雅上下线、启动时检查、断网恢复、推空保护等。

Dubbo 支持基于注册中心的自动实例发现机制,即 Dubbo 提供者注册实例地址到注册中心,Dubbo 消费者通过订阅注册中心变更事件自动获取最新实例变化,从而确保流量始终转发到正确的节点之上。Dubbo 目前支持 Nacos、Zookeeper、Kubernetes Service 等多种注册中心接入。

注册中心

以下是 Dubbo 服务发现接入的一些主流注册中心实现,更多扩展实现与工作原理请查看 注册中心参考手册

注册中心配置值服务发现模型是否支持鉴权spring-boot-starter
Nacosnacos应用级、接口级dubbo-nacos-spring-boot-starter
Zookeeperzookeeper应用级、接口级- dubbo-zookeeper-spring-boot-starter
- dubbo-zookeeper-curator5-spring-boot-starter
Kubernetes Service参考独立使用文档应用级

延迟注册

如果你的服务需要预热时间,比如初始化缓存、等待相关资源就位等,可以使用 delay 参数进行延迟注册。如果是在 Spring 应用中,则 delay = n(n > 0) 延迟的时间是 Spring 上下文初始化完成后开始算起。

@DubboService(delay = 5000)
public class DemoServiceImpl implements DemoService {
}

以上配置后,应用将延迟 5 秒暴露此服务(应用启动 5s 后发布该服务到注册中心)。或者可以配置全局默认值,让所有服务都延迟 5s 后注册:

dubbo:
  provider:
    delay: 5000

优雅上下线

通过控制服务实例发布到注册中心、从注册中心摘除的时机,可以让每个实例平滑的处理所有运行中的请求,做到部署期间的流量无损。以下是推荐的上下线操作顺序:

优雅上线

  1. 配置实例地址延迟(或手动)注册,具体请参考上一节的延迟注册配置方式。

  2. 消费端收到新注册的地址实例后,会对新实例进行预热,即以一定的比例分配少部分流量到新实例,逐步增加比例直到与其他实例对等。

    预热的计算主要有两个因素,第一个是实例启动时间 timestamp,第二个是预热的总时长 warmup,预热总时长可通过 `` 参数设置。计算公式类似:

优雅下线

优雅下线的推荐步骤如下:

  1. 在尝试停止 Dubbo 进程之前,先调用 offline 从注册中心摘除实例地址(建议操作完成后额外等待几秒钟,以确保注册中心地址下线事件生效)。
  2. 通过 kill pid 尝试停止 Dubbo 进程,此时框架会依次检查以下环节:
    • 2.1 框架向所有消费方(通过遍历其持有的 channel 链接)发送 readonly 事件,收到事件的消费方将会停止往该实例发送新的请求。此动作默认开启。
    • 2.2 框架会等待一定的时间,等待线程池中所有运行中的请求处理完成,默认是 10000 毫秒,可通过 -Ddubbo.service.shutdown.wait=20000 调整等待时间。
  3. 以上步骤执行完成后,Dubbo 进程自动停止。

多注册中心

Dubbo 支持在同一应用内配置多个注册中心,一个或一组服务可同时注册到多个注册中心,一个或一组服务可同时订阅多个中心的地址,对于订阅方而言,还可以设置如何调用来自多个注册中心的地址(优先调用某一个注册中心或者其他策略)。

指定全局默认的一个或多个注册中心,所有的服务默认都注册到或订阅配置的注册中心:

dubbo
 registries
  beijingRegistry
   register-mode: instance #新用户建议使用,老用户如继续使用老服务发现模型则删除此配置
   address: zookeeper://localhost:2181
  shanghaiRegistry
   register-mode: instance #新用户建议使用,老用户如继续使用老服务发现模型则删除此配置
   address: zookeeper://localhost:2182

指定某个服务注册到多个注册中心:

@DubboService(registry = {"beijingRegistry"})
public class DemoServiceImpl implements DemoService {}

指定某个服务订阅来自多个注册中心的地址:

@DubboReference(registry = {"beijingRegistry"})
private DemoService demoService

关于多注册中心的更多配置、使用场景说明请参见【参考手册 - 注册中心 - 多注册中心】

应用级vs接口级

Dubbo3 在兼容 Dubbo2 接口级服务发现的同时,定义了新的应用级服务发现模型,关于它们的含义与工作原理请参考 应用级服务发现。Dubbo3 具备自动协商服务发现模型的能力,因此老版本 Dubbo2 用户可以无缝升级 Dubbo3。

只注册

如果有两个镜像环境,两个注册中心,有一个服务只在其中一个注册中心有部署,另一个注册中心还没来得及部署,而两个注册中心的其它应用都需要依赖此服务。这个时候,可以让服务提供者方只注册服务到另一注册中心,而不从另一注册中心订阅服务。该机制通常用于提供程序相对静态且不太可能更改的场景或者提供程序和使用者互不依赖的场景。

dubbo:
  registry:
    subscribe: false

只订阅

为方便开发测试,经常会在线下共用一个所有服务可用的注册中心,这时,如果一个正在开发中的服务提供者注册,可能会影响消费者不能正常运行。可以让服务提供者开发方,只订阅服务(开发的服务可能依赖其它服务),而不注册正在开发的服务,通过直连测试正在开发的服务。

/user-guide/images/subscribe-only.jpg

dubbo:
  registry:
    register: false

权限控制

通过令牌验证在注册中心控制权限,以决定要不要下发令牌给消费者,可以防止消费者绕过注册中心访问提供者。另外通过注册中心可灵活改变授权方式,而不需修改或升级提供者。

/user-guide/images/dubbo-token.jpg

增加以下配置:

dubbo:
  provider:
    token: true #UUID

或者

dubbo:
  provider:
    token: 123456

指定注册地址

当服务提供者启动时,Dubbo 框架会自动扫描本机可用的网络设备地址,并将其中一个有效ip地址注册到注册中心。扫描遵循以下原则或顺序:

  1. 未联网时,返回 127.0.0.1
  2. 在阿里云服务器中,返回私有地址,如: 172.18.46.234
  3. 在本机测试时,返回公有地址,如: 30.5.10.11

对于有多个网络设备的情况,Dubbo 会随机选择其中一个,此时如果注册的 ip 地址不符合预期,可以通过以下方式指定地址。

  • -D 参数指定框架读取的网卡地址,如 -Ddubbo.network.interface.preferred=eth0
  • 系统环境变量指定上报到注册中心的 ip,如 DUBBO_IP_TO_REGISTRY=30.5.10.11

最后,还可以通过在 protocol 中指定 tcp 监听地址,因为监听地址会默认用作发送到注册中心的地址

dubbo:
  protocol:
    name: dubbo
    port: 20880
    host: 30.5.10.11 # 也可以是域名,如 dubbo.apache.org

启动时检查

消费端地址列表检查

Dubbo 缺省会在启动时检查依赖的服务是否可用,不可用时(这里指地址列表为空)会抛出异常,阻止应用初始化完成,以便上线时能及早发现问题,默认 check="true"

可以通过 check="false" 关闭检查,比如,测试时,有些服务不关心,或者出现了循环依赖,必须有一方先启动。注意如果 check="false" 且启动时无地址可用,此时总是会正常返回 rpc 引用,但如果此时发起调用就会出现 “无地址可用异常”,当服务地址列表恢复时,rpc 应用会自动可用。

1. 使用场景

  • 单向依赖:有依赖关系(建议默认设置)和无依赖关系(可以设置 check=false)
  • 相互依赖:即循环依赖,(不建议设置 check=false)
  • 延迟加载处理

check 只用来启动时检查,运行时没有相应的依赖仍然会报错。

2. 配置方式

@DubboReference(check = false)
private DemoService demoService;
dubbo:
  consumer:
    check: false

注册中心连通性检查

除了检查消费者端地址列表之外,Dubbo 还支持与注册中心的连通性检查。默认情况下,不论是提供者、消费者,如果启动阶段连接不上注册中心都会导致进程启动失败。

可以关闭注册中心启动时检查,即使注册中心连接失败进程也会继续正常启动。框架会记录所有失败的注册、订阅动作,并在注册中心链接恢复后尝试重新注册、订阅,直到所有失败事件都重试成功。

dubbo:
  registry:
    check: false

注册中心缓存

当某个服务尝试向注册中心订阅地址时,此时注册中心应该同步返回获当前可用的地址列表,如果此时因网络故障等原因导致读取可用地址列表失败,框架会查询本地缓存的注册中心地址并返回(如不想使用使用缓存地址,可通过设置 check=true 快速失败抛出异常)。失败的订阅动作会被放入一个重试队列,定期重试直到成功,以确保故障恢复后可及时读到最新地址列表。

注册中心缓存文件的默认存放路径是:${HOME}/.dubbo/dubbo-registry-{application-name}-{address}.cache,以一定的间隔定期刷新。

如果不需要注册中心本地文件缓存,可通过以下配置关闭:

dubbo:
  registry:
    file-cache: false

断网恢复

注册中心断网恢复

当 dubbo 进程与注册中心之间的链接中断后,dubbo 框架会自动尝试恢复,并确保链接恢复后所有的已注册或订阅的服务都正常恢复。

消费端地址断网恢复

Dubbo 消费端进程可以通过 tcp 链接自动跟踪提供端实例的可用性,当发现实例不可用时,消费端会自动将不可用的实例转移到不可用地址池,以确保正常的服务调用不受影响。Dubbo 会自动探测被拉黑的不可用地址池,当发现 tcp 链接恢复后,自动从不可用地址池移除。

推空保护

推空保护是对消费端而言的,当推空保护开启后,消费端进程会忽略注册中心推送过来的空地址事件(会继续保留当前内存已有地址列表)。这是避免在一些异常场景下误将注册中心地址列表清空,导致服务调用不可用。

推空保护默认关闭,可通过以下方式开启

dubbo:
  registry:
    enableEmptyProtection: true

直连提供者

如果你的项目开启了服务发现,但在测试中想调用某个特定的 ip,可通过设置对端 ip 地址的 直连模式 绕过服务发现机制进行调用。

问题排查

相比于 client 到 server 的 RPC 直连调用,开启服务发现后,常常会遇到各种个样奇怪的调用失败问题,以下是一些常见的问题与排查方法。

  1. 消费方找不到可用地址 (No Provider available),这里有详细的 具体原因排查步骤
  2. 忘记配置注册中心,从 3.3.0 开始,不配置注册中心地址的情况下,应用也是能够正常启动的,只是应用的任何服务都不会注册到注册中心,或者从注册中心订阅地址列表。
  3. 注册中心连不上,如果配置了 check=false,虽然进程启动成功,可能服务注册、订阅并没有成功。
  4. 消费方因没有有效的地址而启动报错,可以通过配置ReferenceConfig跳过可用地址列表检查,注解示例为 @DubboRerefence(check=false)
最后修改 September 13, 2024: Refactor website structure (#2860) (1a4b998f54)