Dubbo笔记

  1. 何为Dubbo
  2. 其核心部分包含:
  3. Dubbo的由来
    1. 1.背景
  • Dubbo解决了哪些问题
  • Dubbo 调用工作流
  • 何为Dubbo

          Dubbo是一个分布式服务框架,其前身是阿里巴巴开源项目Dubbo,致力于提供高性能和透明化的RPC远程服务调用方案,以及SOA服务治理方案。Dubbo采用全spring配置方式,透明化接入应用,对应用没有任何API侵入,只需用Spring加载Dubbo的配置即可。

    其核心部分包含:

    远程通讯: 提供对多种基于长连接的NIO框架抽象封装,包括多种线程模型,序列化,以及“请求-响应”模式的信息交换方式。

    集群容错: 提供基于接口方法的透明远程过程调用,包括多协议支持,以及软负载均衡,失败容错,地址路由,动态配置等集群支持。

    自动发现: 基于注册中心目录服务,使服务消费方能动态的查找服务提供方,使地址透明,使服务提供方可以平滑增加或减少机器。

    Dubbo的由来

    1.背景

    随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在必行,亟需一个治理系统确保架构有条不紊的演进。

    • 单一应用架构

        当网站流量很小时,只需一个应用,将所有功能都部署在一起,以减少部署节点和成本。
        此时,用于简化增删改查工作量的 数据访问框架(ORM) 是关键。
    • 垂直应用架构

        当访问量逐渐增大,单一应用增加机器带来的加速度越来越小,将应用拆成互不相干的几个应用,以提升效率。
        此时,用于加速前端页面开发的 Web框架(MVC) 是关键。
    • 分布式服务架构

        当垂直应用越来越多,应用之间交互不可避免,将核心业务抽取出来,作为独立的服
      
        务,逐渐形成稳定的服务中心,使前端应用能更快速的响应多变的市场需求。
        此时,用于提高业务复用及整合的 分布式服务框架(RPC) 是关键。
    • 流动计算架构

        当服务越来越多,容量的评估,小服务资源的浪费等问题逐渐显现,此时需增加一个调
      
        度中心基于访问压力实时管理集群容量,提高集群利用率。
        此时,用于提高机器利用率的 资源调度和治理中心(SOA) 是关键。

    Dubbo解决了哪些问题

    透明化的远程方法调用,就像调用本地方法一样调用远程方法,只需简单配置,没有任何API侵入。

    软负载均衡及容错机制,可在内网替代F5等硬件负载均衡器,降低成本,减少单点。

    服务自动注册与发现,不再需要写死服务提供方地址,注册中心基于接口名查询服务提供者的IP地址,并且能够平滑添加或删除服务提供者。

    Dubbo基于RPC(Remote Procedure Call 远程过程调用)协议,服务提供方和服务消费方之间的调用关系:
    dubbo

    节点角色说明:

    • Provider: 暴露服务的服务提供方。
    • Consumer: 调用远程服务的服务消费方。
    • Registry: 服务注册与发现的注册中心。
    • Monitor: 统计服务的调用次调和调用时间的监控中心。
    • Container: 服务运行容器。

    调用关系说明:

    • 服务容器负责启动,加载,运行服务提供者。
    • 服务提供者在启动时,向注册中心注册自己提供的服务。
    • 服务消费者在启动时,向注册中心订阅自己所需的服务。
    • 注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给消费者。
    • 服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选另一台调用。
    • 服务消费者和提供者,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心。

    Dubbo 属于 RPC 框架,连接消费者和生产者,注册中心 监控被调用对象的运行状态

    Dubbo提供的注册中心有如下几种类型可供选择:

    • Multicast注册中心
    • Zookeeper注册中心
    • Redis注册中心
    • Simple注册中心

    Dubbo 调用工作流

    Dubbo 框架是用来处理分布式系统中,服务发现与注册以及调用问题的,并且管理调用过程。

    上面介绍了 Dubbo 的框架分层,下图的工作流就展示了他们是如何工作的。

    工作流涉及到服务提供者(Provider),注册中心(Registration),网络(Network)和服务消费者(Consumer):

    image

    • 服务提供者在启动的时候,会通过读取一些配置将服务实例化。
    • Proxy 封装服务调用接口,方便调用者调用。客户端获取 Proxy 时,可以像调用本地服务一样,调用远程服务。
    • Proxy 在封装时,需要调用 Protocol 定义协议格式,例如:Dubbo Protocol。
    • 将 Proxy 封装成 Invoker,它是真实服务调用的实例。
    • 将 Invoker 转化成 Exporter,Exporter 只是把 Invoker 包装了一层,是为了在注册中心中暴露自己,方便消费者使用。
    • 将包装好的 Exporter 注册到注册中心。
    • 服务消费者建立好实例,会到服务注册中心订阅服务提供者的元数据。元数据包括服务 IP 和端口以及调用方式(Proxy)。
    • 消费者会通过获取的 Proxy 进行调用。通过服务提供方包装过程可以知道,Proxy 实际包装了 Invoker 实体,因此需要使用 Invoker 进行调用。
    • 在 Invoker 调用之前,通过 Directory 获取服务提供者的 Invoker 列表。在分布式的服务中有可能出现同一个服务,分布在不同的节点上。
    • 通过路由规则了解,服务需要从哪些节点获取。
    • Invoker 调用过程中,通过 Cluster 进行容错,如果遇到失败策略进行重试。
    • 调用中,由于多个服务可能会分布到不同的节点,就要通过 LoadBalance 来实现负载均衡。
    • Invoker 调用之前还需要经过 Filter,它是一个过滤链,用来处理上下文,限流和计数的工作。
    • 生成过滤以后的 Invoker。
    • 用 Client 进行数据传输。
    • Codec 会根据 Protocol 定义的协议,进行协议的构造。
    • 构造完成的数据,通过序列化 Serialization 传输给服务提供者。
    • Request 已经到达了服务提供者,它会被分配到线程池(ThreadPool)中进行处理。
    • Server 拿到请求以后查找对应的 Exporter(包含有 Invoker)。
    • 由于 Export 也会被 Filter 层层包裹
    • 通过 Filter 以后获得 Invoker
    • 最后,对服务提供者实体进行调用。

    上面调用步骤经历了这么多过程,其中出现了 Proxy,Invoker,Exporter,Filter。

    实际上都是调用实体在不同阶段的不同表现形式,本质是一样的,在不同的使用场景使用不同的实体。

    例如 Proxy 是用来方便调用者调用的。Invoker 是在调用具体实体时使用的。Exporter 用来注册到注册中心的等等。

    后面我们会对具体流程进行解析。如果时间不够无法阅读完全文,可以把上面的图保存。