中移在线服务有限公司宋桂祥、张洋、王国飞、李先鹏、王辉
1 项目目标和概述
1.1 背景
随着电信行业业务的高速发展,及公司业务数字化、线上化转型需要,各电信集团公司多为规模化多级化发展,在业务公司扩展与公司业务整合过程中,因设备分散、网络不通等问题导致数据链路不通、各业务公司间数据无法实时高效融通赋能生产,阻碍了公司高效快速发展。中移在线服务有限公司同样面临上述问题,亟待数智化支撑能力打通省专数据融通通道,实现断点数据补全,实时赋能一线业务营销服务,助力数据使用质效双提升。
1.2 主要目标
为了较好解决各分中心与省公司数据链路不通、数据交互不充分、数据资源使用效率较低以及各渠道间数据无法实时融通赋能生产等问题,同时为满足各业务部门及分中心对提升数据融通实时性迫切需求,本项目采用“1+N”云边协同架构,如图1所示,构建基于云原生的实时边缘计算能力,实现一站式数据汇聚、融通计算、敏捷分析、知识问答、补全数据服务断点,为中心、分中心各业务条线开展跨域数据融通、全域数据沉淀、全域洞察分析、全触点客户服务提供丰富的数据要素供给,为生产运营、经营分析、管理决策提供高效丰富的实时标签、实时指标、分析报表、触点轨迹服务等实时数据应用,支撑公司5G营销、CHBN领域业务高速发展。同时,本项目引入了面向大数据领域AI大模型等一揽子技术,自主构建智能辅助工具,重点围绕文本对话、会话共享、问答推荐、建议反馈等,提供一站式应用开发运维智能辅助。
图1“1+N”云边协同架构图
1.3 总体概述
实时数据边缘计算能力是基于Flink的实时流式数据处理引擎采用“1+N”云边协同部署架构,部署至分中心边缘节点上的数据加工处理能力,具备实时多源多目标交互、图形化及SQL化可视开发、实时任务容器化运行、智能辅助运营等能力,向开发人员提供了高效、低门槛的实时应用开发服务,面向业务提供了毫秒级全量跨域数据统一数据汇聚、清洗、加工、处理、统计分析及外部交互能力,实现了数据要素高效流通与开放共享,为生产运营、经营分析、管理决策提供了全业务用户意图实时洞察识别、全渠道用户行为轨迹实时融通汇聚、全过程营销服务经营分析决策、全流程开发运维一站式智能辅助应用,支撑了公司5G营销、CHBN领域业务高速发展。实时数据边缘计算创新能力构建主要如下:
1.3.1构建可视化SQL化开发能力,实现多源数据秒级加密融通计算
基于Flink的实时任务开发部署对普通数据开发者具有较高门槛,为降低开发门槛,实时数据边缘计算能力基于Javastream与SQL化数据加工处理能力封装了图形化、SQL化的实时应用低代码开发组件,支持数据格式转换、过滤、补全、关联、时间窗口计算等功能,通过控件拖拽的方式快速实现实时应用建设,从应用开发到单元测试,再到程序部署和日志查询,实现了全流程可视化操作,提升了实时应用开发效率。
图2 可视化SQL开发流程图
同时为了减少边缘数据传输风险,实现数据就近融通,实时数据边缘计算能力支持属地存储、自定义数据加解密,保障了数据融通的高可靠传输与应用,实现了实时数据交互与计算属地化开展,从而避免了数据出省,缩短了数据处理延迟,保障了数据可靠安全,助力分中心高效融通一二级渠道数据、省专业务系统数据及客户轨迹数据。
1.3.2构建1+N的云边协同能力,实现省专数据多集群跨域实时计算
基于“Docker+K8S”云原生技术的云边协同自治能力采用“中心+单元+节点”三级隔离架构设计,将实时数据处理平台实时应用部署分中心边缘云节点,将边缘云作为区域隔离单元,具备所有容器技术优势的同时可自动感知边缘容器故障范围,全场景覆盖中心/边缘断网、弱网、Pod故障、组件故障、节点故障及区域故障,确保了业务稳定运行不中断,连续性达到“99.999%”。同时它具备自动部署、快速扩缩容、可视化管理等服务化能力,为业务系统提供了稳定、高效的实时数据融通服务的同时有效提升了服务器的资源使用率以及组件的运维效率。
图3 云边协同自治三级隔离架构图
“1+N”云边协同的边缘数据融算能力,充分发挥了中心与边缘算力,较好地缓解了中心实时数据计算压力,缩短了数据传输链路,提升了数据计算效率,同时降低了中心洛阳、淮安机房的网络带宽压力。
1.3.3构建面向大数据领域AI大模型助手,实现应用开发运维一站式智能辅助
本项目创新性地引入面向大数据领域应用的大模型、向量知识库等智能化能力底座,自主构建智慧运营助手,实现运营、开发、分析等场景化咨询和答疑。面向开发人员,该助手提供实时数据开发指导帮助、开发规范查询、常见问题解答及词法语法检查纠错;面向业务运营人员,该助手提供数据报表图表呈现、指标趋势分析等智能化运营辅助。基于参数微调、RAG、文本和语义相似度混合索引等技术,本项目创新性地将离线文档(知识库)、实时接口(数据库等)查询逻辑与智能辅助流程融合,实现智能体应用,系统根据用户提问内容,解析意图,转发至知识库或实时数据接口等,获取运营、开发、运维知识,由大模型理解知识并生成结果,呈现至用户。
图4 智能辅助交互图
2 案例介绍
2.1 系统架构
实时数据处理平台借助Flink容器化+云边协同框架建立“中心+边缘”分布式计算的能力,如图5所示。云端部署的Flink-Operator组件会统一管理各分中心Flink集群生命周期,其中FlinkCluster根据业务预先定义完成集群容器方式编排部署,并基于资源池匹配调度能力,完成实时任务调度到指定的边缘计算节点上;依靠边端负载均衡调度器提供服务暴露,来实现任务状态信息查询。同时为消除对本部HDFS、ZooKeeper高可用模式的依赖,降低边端Flink外部中间件依赖复杂度,Flink在边缘部署时采用Kubernetes高可用模式,并基于OSS对象存储实现任务状态管理。
图5 系统架构图
2.2 硬件平台
在云网一体化战略规划下容器云已经将计算能力下沉至分公司,实现云边协同一点管控,可以基于容器底座为实时数据处理平台提供统一的边缘计算支撑。通过建立边缘Flink分布式计算框架,实时数据处理平台能够充分利用容器云平台的弹性算力优势来满足大数据实时处理资源需求的增长,助力云数融通创新发展。硬件管理架构图如图6所示。
图6 硬件管理架构图
2.3 软件平台
实时数据边缘计算平台是基于实时Flink流式数据加工引擎采用“1+N”云边协同部署架构,部署至各分中心边缘节点的数据加工处理能力,集专业计算、资源管控、性能分析、数据治理、租户管理、任务监控、智能辅助运营于一体,为实时任务开发人员提供了低代码、低门槛的数据开发平台。它基于Javastream与SQL数据加工处理能力封装了图形化、SQL化的实时应用低代码开发组件,支持数据格式转换、过滤、补全、关联、时间窗口计算等功能,通过控件拖拽的方式可快速实现实时应用建设,从应用开发到单元测试,再到程序部署和日志查询,实现了全流程可视化操作,并以业务需求为导向,为各业务实时应用提供了丰富的数据要素供给,满足了业务侧营销服务、热线运营、监控预警等需要。同时它引入了AI大模型、知识向量库构建智能辅助工具,为运营、开发、分析提供了全流程开发运维一站式智能辅助。平台功能架构图如图7所示。
图7 平台功能架构图
2.4 数据通讯
为较好解决省专数据融通链路不通、时效低、中心网络带宽压力大、数据传输安全风险以及单点故障风险等问题,本项目构建了边缘实时数据融通高效交互能力。如图8所示,在网络通讯方面,本项目采用“中心分中心”承载网交互、“省移动/专业公司-分中心”内网交互模式,实现了数据链路打通采用不同网络交互模式,降低了中心网络带宽计算压力,同时减少了数据传输时间。在数据处理方面,本项目基于属地就近数据融通计算,减少了数据计算与传输延迟,提高了处理速度。在存储方面,本项目基于属地数据库、FTP服务器、Kafka、redis、MQ等多目标交互存储,提升了边缘计算平台的兼容性。在数据安全防护方面,本项目与省/专公司建立协同机制,构建了一体化数据传输加解密能力,同时针对敏感数据本地存算,降低了数据泄露的风险。在系统高可用方面,为减少云边下沉对本部Zookeeper高可用依赖,同时减少分中心Zookeeper部署与运维,本项目采用基于k8s容器底座实现FlinkJobManager组件高可用,移除对Zookeeper的依赖,降低了单点故障的风险,提高了系统的稳定性。
图8 数据交互架构图
2.5 安全措施
在数据传输过程中,为保障数据传输安全,加密传输安全措施必不可少,其中密钥的生成、传输、存储和使用都是至关重要的环节。一旦密钥泄露,整个加密系统便形同虚设,数据的安全性将无法得到保障。为了保障省端数据融通的高可靠传输与应用,实时数据边缘计算能力在数据传输时支持自定义构建对称加密、非对称加密等多种数据传输加密方式,保障了数据传输安全。
3 代表性及推广价值
3.1 创新应用情况及效果
截至2024年11月,实时数据处理基于“1+N”云边协同架构,完成系统部署规模超200台主机,其中边缘数据应用16个单位,用户数1000余人,日均实时数据融通处理中心数据量约1000亿条,边缘数据融通数据量约1亿余条,累计承载实时任务4200个,其中中心任务4000余个,边缘实时任务200余个。系统重点围绕全业务用户意图实时洞察识别、全渠道用户行为轨迹实时融通汇聚、全过程营销服务经营分析决策、全流程开发运维一站式智能辅助应用赋能,为公司热线、互联网运营、营销与智能策略服务等提供了高效、实时的数据融通服务,助力数据要素价值高效释放。以下为四大实时边缘数据融通赋能场景:
3.1.1 全业务用户意图实时洞察识别
截至2024年11月,系统重点围绕业务订购、活动到期、流量超套、话费超套等分中心重点营销服务场景边缘实时标签建设240余个,为千人千面营销、个性化服务推荐、用户群体的生命周期管理提供了全业务用户意图实时洞察识别,其中江西分中心自建实时标签疏忙分流策略应用36项,主动服务策略9项,分流策略命中量年均233.8万,人机协同疏忙来话年均146万,主动服务策略命中年均351万,有效分流率68.64%,满意度保持90%以上。河南分中心自建实时标签年均服务生产11.1亿次,实时超套标签中台营销办理238.8万笔,转化率达19.2%,较非瞬时营销类项目成功率高5.8PP。
图9 意图洞察智能策略服务应用
3.1.2 全渠道用户行为轨迹实时融通汇聚
目前系统已融通省端BOSS系统短信、CRM系统业务办理、热线、互联网、工单等渠道省专轨迹数据,日融通数据量10余亿条,补全数据断点,实现跨触点、跨平台省专触点客户轨迹数据融通汇聚。系统为投诉溯源、产品推荐、意图识别、跨渠道营销服务协同等提供实时数据服务月调用量约5.4亿次。其中新疆“热外呼”营销已承载提速包、流量高饱和、IVR商机引导、权益偏好等场景20余个,月均触客71.87万,签单量12.57万,营销转化率达到17.49%,高价值业务办理量5.52万,占比43.9%。相比传统外呼营销呼通率提升8.76pp,签单率提升9.39pp,同时每项外呼任务可节省2-3人天工作量。
3.1.3 全过程营销服务经营分析决策
目前系统已承载分中心边缘实时指标建设700余个,重点围绕话务服务、产品精准营销、坐席精细化管控等,提供全过程全链路营销服务经营分析决策。其中四川分中心构建短信群发回拨联动话务监控分析,辅助坐席实时话务异动原因定位,保障话务接通率;陕西分中心构建省专营销产能监控,针对重点营销业务分渠道、分团队、分队列等进行实时产能监控,帮助管理层发现内在规律、发掘深度规律、指导经营决策,助力各渠道、团队等快速实现营销目标分解与目标达成。
图10 营销产能监控分析
3.1.4 全流程开发运维一站式智能辅助
目前已面向系统开发、运营、运维人员提供智能辅助流程编排能力,面向应用使用方人员提供文本对话、会话共享、问答推荐、建议反馈等能力,辅助用户解答系统使用、开发规范、优秀案例、常见问题及进行指标报表开发和呈现。
已完成全网运营、运维4大场景、70余文档、2000余知识点及2个实时接口数据采编录入,服务1022个开发运营运维人员应用。
3.2 经济价值
本成果主要为业务系统提供高效、低成本的实时数据处理能力,助力业务系统降本增效,直接节省了业务系统建设+运维成本开支约69万元,节约了一线坐席话务成本409人年。
(1)任务运行服务器资源节省。基于云原生容器化实时边缘任务运行,较标准物理主机运行由2CPU、2GB减少至0.6CPU、2GB运行,平台承载实时边缘计算任务200余个;减少物理服务器约3台(单台ARM服务器规格为128CPU/384GB),节约服务器投资成本24万元(单台ARM服务器投资成本8万元)。
(2)任务开发成本节省。基于低代码可视化应用开发一个实时任务或应用节省年度开发、运维成本2人天,目前承载实时任务200个,按照1人年=30万元=22人天*12月=264人天计算,200任务*2人天÷264人天*30万=45万元。
(3)业务效能成本节省。以实时标签话务分流策略应用,月策略命中通话量628万,月分流话务198万通,结合一线坐席反馈每220通话务可节省1人天,节约一线坐席话务成本=198万通*12个月/220通/264年工作日=409人年。
3.3 社会价值
通信是国民经济的基础设施,提高通信服务质量有利于提高劳动生产率,方便人民生活,在这些方面所带来的社会宏观经济效益是巨大的。中国移动在线营销服务中心的使命是为客户创造便捷和快乐,致力成为客户满意、社会信赖的服务专家。
本成果建设后,基于边缘实时数据处理能力可以提升业务数据处理效率,提升客服人员工作效率和服务质量,促进电信运营商行业客服服务水平和质量提升。同时,该成果也实现了实时投诉预警建设,有利于及时发现客户不满意方面,及时做出调整,服务客户需求,提升服务水平和提升公司形象。
该成果可进行单独部署,功能多样,可应用于银行、证券、智慧城市、电子政务等其他民生行业,对促进社会经济发展具有良好效益。
3.4 技术示范与可推广性
目前实时边缘计算已应用至16个分中心,完成标准化案例沉淀10余个,聚焦实时数据融通低门槛、可复用、自动化运维、多介质数据融通适配、多数据要素供给共享、云边多节点协同等总结输出了一套高效标准的运营推广与技术支撑模式,为高效数据融通赋能营销服务全过程全流程高质量发展提供了运营和技术支撑。
图11 运营推广与技术支撑模式图
门槛低:提供可视化拖拽式开发能力,一线开发运营分析人员容易学习上手,无渠道、场景限制,低代码开发,有助于业务场景创新落地。
可复制:基于实时数据边缘计算的实时应用可移植性强,可快速复制应用,降低重复开发成本,提升应用构建效率。
自动化:实时任务异常具备自动化拉起,资源使用具备自动推荐,异常日志具备自动诊断。
多介质适配:支持不同渠道不同存储介质融算适配,实现多渠道多目标数据高效汇聚统一管理,支持跨渠道数据融合运营分析,助力运营效率提升。
多数据共享:业务数据一次加工处理,多渠道多场景复用,减低数据清洗加工成本,提升数据应用构建效率,缓解计算资源压力。
多节点协同:实时数据处理平台,可实现“中心+边缘”多节点协同部署,系统可移植性强,有助于系统商用推广。
摘自《自动化博览》2025年2月刊