BFF层聚合查询服务异步改造及治理实践|京东云技术团队-6ren

BFF层聚合查询服务异步改造及治理实践|京东云技术团队

转载作者：我是一只小鸟更新时间：2023-06-02 14:31:19

30

4

首先感谢王晓老师的[ 接口优化的常见方案实战总结 ]一文总结，恰巧最近在对稳健理财BFF层聚合查询服务优化治理，针对文章内的串行改并行章节进行展开，分享下实践经验，主要涉及原同步改异步的过程、全异步化后衍生的问题以及治理方面的思考与改进.

希望通过分享这些经验，能够对大家的工作有所启发和帮助。如果有任何问题或建议，请随时提出.

1、问题背景

将不同理财产品（如基金、券商、保险、银行理财等）针对不同投放渠道人群进行个性化商品推荐，每个渠道或人群看到的商品或特性数据又各不相同，为方便渠道快速对接，由BFF层统一对所有数据进行聚合下发，因此BFF层聚集依赖了大量底层原子服务，所以主要问题是在依赖大量上游接口的场景下保障TP99、以及可用率.

案例：

以其中比较典型的商品推荐接口为例，需要依赖本地商品池缓存、算法推荐服务、商品基础信息服务、持仓查询服务、人群标签服务、券配置服务，可领用券服务、其他数据服务ServN……等等，其中大部分上游原子接口对单次批量查询支持有限，所以极端情况，单个推品接口单次推荐1-n个推品，每个商品如果要绑定10个动态属性，至少需要发起(1~n)*10次io调用.

改造前的流程和问题：

流程:

问题:

一是逻辑流程强耦合，很多上下游服务强同步依赖；。
二是链路较长，其中某个上游服务不稳定时很容易造成整体链路失败.

改造后的流程和实现的目标：

流程:

目标:

改造目标也很明确，就是对现有逻辑改造，尽可能增加弱依赖比例，一是方便异步提前加载，二是弱依赖代表可摘除，为降级操作奠定基础，减少因某个链路抖动影响整体链路失败；

初步改造后的新问题【【重点解决】】：

▪逻辑上解耦比较简单，无非就是前置参数或冗余加载，本次不展开探讨；。

▪技术上改造前期异步逻辑主要是采用@Async("tpXXX")标注，这也是最快捷实现的方式，但也存在以下几个问题，主要是涉及治理方面:

随着项目和人员不断迭代，造成@Async注解满天飞；。
不同人员在不熟悉其他模块的情况下，无法界定不同线程池的是否可公用，大多都会采用声明新的线程池，造成线程池资源泛滥；。
部分调用场景不合理造成@Async嵌套过多或注解失效问题；。
降级机制重复代码太多，需要频繁手动声明各种降级开关；。
缺少统一的请求级别的缓存机制，虽然jsf已经提供了一定程度的支持；。
线程池上下文传递问题；。
缺少线程池状态的统一监控报警，无法观测实际运行过程中的每个线程池状态，可能每次都是拍脑袋觉设置线程池参数.

2、整体改造路径

切入点：

鉴于大部分项目都会封装单独的io调用层，比如 com.xx.package.xxx.client，所以以此为切入点进行重点改造治理。

最终目标：

实现、应用简单，对老代码改造友好，尽可能降低改造成本；。

抽象io调用模板，统一io调用层封装规范，标准化io调用需要的增强属性声明并提供默认配置，如所属线程池分配、超时、缓存、熔断、降级等；。
优化@Async调用，所有io异步操作统一收缩至io调用层，在模板层实现回调机制，老代码仅继承模板即可实现异步回调,
请求级别的缓存实现，默认支持r2m,
请求级别的熔断降级支持，在上游故障时使服务实现一定程度的自治理；。
线程池集中管理，对上下文自动传递MDC参数提供支持；。
线程池状态自动可视化监控、报警实现；。
支持配置中心动态设置.

具体实现：

1. io调用抽象模板

模板主要作用是进行规范和增强，目前提供两种模板，默认模板、缓存模板，核心思想就是对io操作涉及的大部分行为进行声明，比如当前服务所属线程池分组、请求分组等，由委托组件按照声明的属性进行增强实现，示例如下:

主要是提供代码级别的默认声明，从日常实践看大部分采用开发时的代码级别的配置即可.

2. 委托代理

此委托属于整个执行过程的桥接实现，io封装实现继承抽象模板后，由模板创建委托代理实例，主要用于对io封装进行增强实现，比如调用前、调用后、以及调用失败自动调用声明的降级方法等处理.

可以理解为：模板专注请求行为，委托关注对象行为进行组合增强.

3. 执行器选型

基于前面的实现目标，减少自研成本，调研目前已有框架，如 hystrix、sentinel、resilience4j，由于主要目的是期望支持线程池级别的壁舱模式实现，且hystrix集成度要优于resilience4j，最终选型默认集成hystrix，备选resilience4j，以此实现线程池的动态创建管理、熔断降级、半连接重试等机制，HystrixCommander实现如下:

4. hystrix 适配 concrete 动态配置

1、继承concrete.PropertiesNotifier, 注册HystrixPropertiesNotifier监听器，缓存配置中心所有以hystrix起始的key配置；。

2、实现HystrixDynamicProperties，注册ConcreteHystrixDynamicProperties替换默认实现，最终支持所有的hystrix配置项，具体用法参考hystrix文档.

5. hystrix 线程池上下文传递改造

hystrix已经提供了改造点，主要是对HystrixConcurrencyStrategy#wrapCallable方法重写实现即可，在submit任务前暂存主线程上下文进行传递.

6. hystrix、jsf、spring注册线程池状态多维可视化监控、报警

主要依赖以下三个自定义组件，注册一个状态监控处理器，单独启动一个线程，定期(每秒)收集所有实现数据上报模板的实例，通过指定的通道实现状态数据推送，目前默认使用PFinder上报:

ThreadPoolMonitorHandler 定义一个线程状态监控处理器，定期执行上报过程；。
ThreadPoolEndpointMetrics 定义要上报的数据模板，包括应用实例、线程类型（spring、jsf、hystrix……）、类型线程分组、以及线程池的几个核心参数；。
AbstractThreadPoolMetricsPublisher 定义监控处理器执行上报时依赖的通道（Micrometer、PFinder、UMP……）.

例如以下是hystrix的状态收集实现，最终可实现基于机房、分组、实例、线程池类型、名称等不同维度的状态监控:

PFinder实际效果：支持不同维度组合查看及报警。

7. 提供统一await future工具类

由于大部分调用是基于列表形式的异步结果List<Future >、Map<String,Future >，并且hystrix目前暂不支持返回CompletableFuture，方便统一await，提供工具类:

8. 其他小功能

1、除了sgm traceId支持，同时内置自定义的traceId实现，主要是处理sgm在子线程内打印traceId需要在控制台手动添加监控方法的问题以及提供对部分无sgm环境的链路Id支持，方便日志跟踪；。

2、比如针对jsf调用，基于jsf过滤器实现跨应用级别的前后请求id传递支持；。

3、默认增加jsf过滤器实现日志打印，同时支持provider、consume的动态日志打印开关，方便线上随时开关jsf日志，不再需要在client层重复logger.isDebugerEnabled()；。

4、代理层自动上报io调用方法、fallback等信息至ump，方便监控报警.

日常使用示例：

1. 一个最简单的io调用封装

仅增加继承即可支持异步回调，不重写线程池分组时使用默认分组.

2. 一个支持请求级别熔断的io调用封装

默认支持的熔断级别是服务级别，老服务仅需要继承原请求参数，实现FallbackRequest接口即可，可防止因为某一个特殊参数引起的整体接口熔断.

3. 一个支持请求级别缓存、接口级别熔断降级、独立线程池的io调用封装

4. 上层调用，实际效果

1、直接将一个商品列表转换成一个异步属性绑定任务；。

2、利用工具类await List<Future >；。

3、在上层无感知的状态下，实现线程池的管理、熔断、降级、或缓存逻辑的增强，且可根据pfinder监控的可视化线程池状态，通过concrete实时调整线程池及超时或熔断参数；。

4、举例：比如某接口频繁500ms超时，可通过配置直接打开短路返回降级结果，或者调低超时为100ms，快速触发熔断，默认10s内请求总数达到20个，50%失败时打开断路器，每隔5s半链接重试.

3、最后

本篇主要是思考如何依赖现有框架、环境的能力，从代码层面系统化的实现相关治理规范.

最后仍引用王晓老师文章结尾来结束。

接口性能问题形成的原因思考我相信很多接口的效率问题不是一朝一夕形成的，在需求迭代的过程中，为了需求快速上线，采取直接累加代码的方式去实现功能，这样会造成以上这些接口性能问题。变换思路，更高一级思考问题，站在接口设计者的角度去开发需求，会避免很多这样的问题，也是降本增效的一种行之有效的方式。以上，共勉！。

作者：京东科技刘大朋。

来源：京东云开发者社区。

最后此篇关于BFF层聚合查询服务异步改造及治理实践|京东云技术团队的文章就讲到这里了,如果你想了解更多关于BFF层聚合查询服务异步改造及治理实践|京东云技术团队的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

30

4

0

文章推荐：如何在.net6webapi中配置Jwt实现鉴权验证

文章推荐： Go开源库运行时依赖注入框架Dependencyinjection

文章推荐：算法题分析：反转整数

Mysql 查询 JOIN 查询
我有三张 table 。表 A 有选项名称(即颜色、尺寸)。表 B 有选项值名称(即蓝色、红色、黑色等)。表C通过将选项名称id和选项名称值id放在一起来建立关系。我的查询需要显示值和选项的名称，而
查询
在mysql中，如何计算一行中的非空单元格？我只想计算某些列之间的单元格，比如第 3-10 列之间的单元格。不是所有的列...同样，仅在该行中。最佳答案如果你想这样做，只能在 sql 中使用名称而
sql - 查询、 native 查询、命名查询和类型化查询之间的区别
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 7 年前。 Improve this ques
elasticsearch - 在Elasticsearch查询中没有为[查询]注册的[查询]
我正在为版本7.6进行Elasticsearch查询我的查询是这样的: { "query": { "bool": { "should": [ {
sql - 查询、 native 查询、命名查询和类型化查询之间的区别
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 7 年前。 Improve this ques
php - Mysql WHERE NOT EXISTS(查询)OR(查询)
是否可以编写一个查询来检查任一子查询(而不是一个子查询)是否正确？ SELECT * FROM employees e WHERE NOT EXISTS (
javascript - 查询。为表中的每一行发送 ajax 查询
我找到了很多关于我的问题的答案，但问题没有解决我有表格，有数据，例如: Data 1 Data 2 Data 3
salesforce - SOQL 查询 - 如何通过将字段设为小写并进行比较来编写 SOQL 查询？
以下查询返回错误: 查询: SELECT Id, FirstName, LastName, OwnerId, PersonEmail FROM Account WHERE lower(PersonEm
salesforce - SOQL 查询 - 如何通过将字段设为小写并进行比较来编写 SOQL 查询？
以下查询返回错误: 查询: SELECT Id, FirstName, LastName, OwnerId, PersonEmail FROM Account WHERE lower(PersonEm
Android SQLite 查询(我想解析一般的 SQL 查询)
我从 EditText 中获取了 String 值。以及提交查询的按钮。 String sql=editQuery.getText().toString();// SELECT * FROM empl
mysql 查询 - 为一个巨大的表优化现有的 MAX-MIN 查询
我有一个或多或少有效的查询(关于结果)，但处理大约需要 45 秒。这对于在 GUI 中呈现数据来说肯定太长了。所以我的需求是找到一个更快/更高效的查询(几毫秒左右会很好)我的数据表大约有 3000
SQL 查询 - 将 NULL 结果添加到 SELECT 查询
这是我第一次使用 Stack Overflow，所以我希望我以正确的方式提出这个问题。我有 2 个 SQL 查询，我正在尝试比较和识别缺失值，尽管我无法将 NULL 字段添加到第二个查询中以识别缺失
sql - 什么是动态 SQL 查询？何时需要使用动态 SQL 查询？
什么是动态 SQL 查询？何时需要使用动态 SQL 查询？我使用的是 SQL Server 2005。最佳答案这里有几篇文章: Introduction to Dynamic SQL Dynami
php - 在另一个 mysql 查询 while 循环中调用 mysql 查询
include "mysql.php"; $query= "SELECT ID,name,displayname,established,summary,searchlink,im
java - MySQL 查询 "select top 5"查询
我有一个查询要“转换”为 mysql。这是查询: select top 5 * from (select id, firstName, lastName, sum(fileSize) as To
c# - Entity Framework 查询 ToString 不会产生 SQL 查询
通过我的研究，我发现至少从 EF 4.1 开始，EF 查询上的 .ToString() 方法将返回要运行的 SQL。事实上，这对我来说非常有用，使用 Entity Framework 5 和 6。但
MySQL 查询(或 Doctrine 1.2 查询)- 从连接表和过滤器中获取最新项目
我在构造查询来执行以下操作时遇到问题: 按activity_type_id过滤联系人，仅显示最近事件具有所需activity_type_id或为NULL(无事件)的联系人表格结构如下: 一个联系人可
php - 如何在执行另一个 SQL 查询 x 分钟后执行一个 SQL 查询？
如何让我输入数据库的信息在输入数据 5 分钟后自行更新？假设我有一张 table : +--+--+-----+ |id|ip|count| +--+--+-----+ |
database - 如何在 N1QL 查询(Couchbase 查询)中使用 LENGTH() 字符串函数
我正在尝试搜索正好是 4 位数字的 ID，我知道我需要使用 LENGTH() 字符串函数，但找不到如何使用它的示例。我正在尝试以下(和其他变体)但它们不起作用。 SELECT max(car_id)
php - 将 SQL 查询 (+JOIN) 转换为 Symfony Propel 查询
我有一个在 mysql 上运行良好的 sql 查询(查询 + 连接): select sum(pa.price) from user u , purchase pu , pack pa where (

首页

博学

6Ren·AI

商城

BFF层聚合查询服务异步改造及治理实践|京东云技术团队

1、问题背景