1 方案背景与目标
数据是产业发展的基础支撑,高质量的数据集则是推动智能制造升级的核心驱动力,当前训练范式正逐渐向“数据中心化”转变。在离散行业中,快速响应生产系统面临订单波动、供应链扰动等不确定性因素,在此情况下,破解垂类模型与智能化应用落地过程中的“数据瓶颈”已成为亟待解决的问题。
聚焦破解离散行业快速响应生产中的“数据困境”,提升工业数据治理与利用效能,构建工业人工智能数据工程平台。通过研究面向离散制造行业的垂类大模型数据多模态智能对齐与价值增强融合、人机协同智能标注、全解耦数据资源管理等技术,创新数据合成、加工和融合方法,解决离散制造业中数据多源异构、样本稀缺和质量不均等核心痛点,为垂类模型提供高质量训练数据基础。面向离散行业快速响应生产的的数据工程平台,构建数据安全防护和标准规范体系,助力工业数据资源综合治理和开发利用。
计划完成人工智能数据工程关键技术研究和平台建设,实现:支持文本、图片、音频、视频等4种不同模态数据清洗加工、人机标注及数据合成,支持ERP、CRM、SCM、MES、PDM和PLM等不少于6类工业系统的数据融合,在不少于10家工业企业开展示范应用。
2 方案详细介绍
(1)研发一套AI数据工程技术产品赋能千行百业“数智化”转型服务
项目研发团队根据工程业务和用户实际需求,研发支撑人工智能训练资源库的数据采集、数据标注、数据训练、AI推理等一站式AI服务产品,以及数据资源管理中台等技术产品。目前针对离散行业高质量数据集数据加工技术,包括智能化数据清洗、异构数据潜在特征提取等数据预处理关键技术,多模态数据融合、数据质量自动评估算法,小样本数据增强合成、人机协同智能标注等技术展开攻关。以下对核心技术和产品展开介绍。
1)人机协同数据标注技术
数据标注子平台提供数据接入、预处理以及数据标注等服务。同时,易华录具备专业的标注团队,实现数据采集1400万+、标注数据3000万+、标注标框3800万+、标注需求900+、标注项目900+。基于工业、公安、交通、医疗等20+个行业数据的规模化应用。建设亿级规模图数据,千万级规模视频、音频、文本数据,标注准确率超过99%,打造行业领先人工智能训练资源库,实现千级算法推理服务,丰富智能交通、智慧物流、智慧医疗等关键领域的算法训练推理场景,推动赋能产业链协同转型。

图 1标注库

图 2标注数据统计

图 3标注数据统计

图 4 一站式加工服务
2)多模态数据资源管理平台
研制多模态数据资源管理平台,实现多模态数据自动化采集、数据管理、算法仓及AI推理、数据资源库等功能,基于多模态数据汇聚、点位治理、视图解析、数据治理、数据脱敏等技术手段,完成多模态数据“收存治用易”全生命周期管理,激活数据价值;研制数据治理一体化使能工具集,包括数据治理、数据处理等软件工具,实现行业数据资源统一治理、高效管理、数据质量源头监管。面向全域全数据,通过技术和运营手段,提升数据赋能成效,促进数据要素流入、生产、运营、管理千场万景,激活数据潜能、释放数据红利。

图 5数据资源目录

图 6数据融合
(2)产品应用推广情况
1)大连亚明“5G+工业互联网平台”
项目基于工业领域数据技术产品,为汽车零部件企业提供轻量级定制化场景解决方案,从感知层、平台设施、数据中心、应用平台四个维度构建有行业特色的专业化平台。在大连亚明企业的供应链协同、设备上云与互联互通等方面开展数字化转型与智能化升级合作。借助应用平台研发成果,实现不少于20种缺陷高精度检测支持,全种类缺陷综合识别准确率超98%,产品不良品率降低27%。

图 7 压铸车间3050T压铸设备生产看板

图 8 数据可视化系统
2)大连华松智能工场可视化管理系统建设项目
易华录AI数据工程技术产品,支撑了该项目数字孪生三维模型、视频智能解析应急和数据中台的搭建,形成含数据治理、管理、可视化的初期智慧大脑。
智能驾驶舱通过详尽的指标体系,实时反映工场生产的运行状态,将采集的生产过程各环节数据进行形象化、直观化、可视化、具体化,一是为生产改善提供PDCA的基础,二是给管理者提供决策支撑。

图 9 智能驾驶舱
接入设备信息、订单数据、人员数据、品质数据、仓库数据、生产数据、视频监控等数据并进行数据治理服务,支撑驾驶舱软件的数据呈现和分析功能,进行器具台账使用状态分析。

图 10 器具台账使用状态分析
从人机料法环测六方面,实现生产设备及能源终端的数据自动化采集、智能化控制及初步的能源管理。

图 11 可视化管理
3)大连金华录“SMT”项目
易华录AI数据工程技术产品,支撑MES制造执行系统进行车间生产全流程优化闭环管理,降低企业生产中存在的风险,提高企业的生产效率,助推企业经济效益逐年稳步提升。对人员、关键零部件以及关键工艺参数进行记录、存档并可以追溯;对产品质量进行监控管理,实现了产品质量管理的高效性;集成MES、ERP等生产核心系统,为调度指挥、大数据分析、数字化平台等提供数据支撑,共享业务数据。

图 12 设备管理

图 13 数据分析与可视化
4)江苏双登数字化转型项目
易华录AI数据工程技术产品,围绕业务系统数据的集成、展示、分析与决策展开,以提升企业数字化及协同效率为核心,通过数据接入、清洗、转换形成原始库,依标准规范建标准库,按业务主题重组数据建主题库、专题库和指标库,为数据可视化和上层应用服务。
双登数字化管理驾驶舱能快速掌握运营情况,监控业务绩效,支持深度分析。不仅展示表层核心指标,更能通过钻取、联动、过滤等操作,从现象深入探究原因。监控每日进度和产出,及时发现生产问题,确保战略目标得以逐日分解和达成。

图 14 双登数字化管理驾驶舱
双登数字孪生聚焦厂区室外场景和设备生产全流程的精细化管理。利用多视角三维重建技术,自动化生成覆盖地上地下、室内室外、宏观微观的智慧工厂数字孪生体模型。为设备生产全流程的可视化管理提供精确的数据本底,满足公司提升生产管理质量的要求。

图 15 双登数字孪生
5)天津智能交通设备生产线产业化升级
依托易华录公司数据技术产品对已经建成交通运输设备生产制造进行数字化改造,搭建人工智能数据工程平台体系、提升安全保障能力为支撑,推动交通运输设备制造全要素、全产业链连接,完善协同应用生态,建设数字化、网络化、智能化制造和服务体系。实现一体化研发制造体系和全生命周期数据追溯与分析。
数字化改造生产制造装备包括信控设备、电子警察、超速监测、视频监控设备、移动警务通、高精度北斗车载终端、车路协同交通控制装备、边云协同交通控制装备、车载数字娱乐设备、拼接显示单元等几大类,属于智慧交通领域的核心产品。


图 16、17 天津智能交通设备生产线产业化升级
6)天津未来科技园智算中心升级改造项目
依托易华录公司数据技术产品,升级改造天津未来科技园智算基础设施,以支持主流及行业垂直大模型,确保跨行业大模型高效适配与落地应用。信息技术(IT)层面:采集各类软硬件运行状态数据,为上层系统的故障分析、能耗分析及业务与能耗关系分析等提供支撑。人工智能(AI)预测性维护:通过平台采集含故障特征数据的样本,如温度、电压/电流等,结合人工经验训练高准确度故障预测模型,实现风险管理、故障预测等功能。

图18 智算中心升级
7)包头钢铁工业互联网建设项目
针对包钢集团实际的生产场景的痛点、难点,易华录项目团队围绕数据资源管理子平台、全流程质量管理、电机全生命周期管控、机器视觉安全等方面进行人工智能数据工程平台的建设,提升了包钢集团的数字化、自动化建设程度,实现了生产流程上的少人化、无人化管理,提高了巡检、反馈控制的响应效率及准确率,大幅降低人力成本。同时,通过打通人流、物流、信息流、资金流中的关键瓶颈问题,实现企业降本增效、节能降耗和安全环保的总体目标。

图19 能耗管理平台架构
3 技术创新点
(1)提出面向离散制造的垂类模型数据融合与合成创新框架
解决离散制造业中数据多源异构、样本稀缺和质量不均等核心痛点,研究多模态工业数据的特征提取与融合机制,以及基于纵向联邦学习等技术在保护数据隐私前提下进行数据合成与增强的方法。框架的创新性体现在利用混成模型、强化学习与记忆网络等自适应技术,实现数据融合与合成过程的动态优化,从而提升生产效率与决策智能水平。通过创新性的数据合成、加工和融合方法,为垂类模型提供高质量训练数据基础。
下一步:针对离散制造业多模态数据难统一处理问题,攻克跨模态时空对齐算法与小样本生成式增强技术、注入行业知识的数据加工与质量提升技术等。

图20 面向离散行业数智能效优化的磁光电融合存储底座
(2)基于预训练模型与主动学习的智能标注技术
基于多模态数据特征融合与跨模态协同技术研究,实现关键特征自动提取,提供高效、优质、高精度的数据标注服务,为人工智能模型训练奠定数据基础,支持规模化数据预标注与数据闭环校验管理。实现单条数据标注时间压缩至秒级,特征标注准确率不低于95%。通过多维度数据统计、多重审核机制、专业标注团队和实时量化可视化管理系统,构建完备质量监督体系。
下一步:持续开发支持文本、图像、音频、视频等多种数据类型的专业标注工具,集成智能标注辅助功能,建立包括人工抽检、结果评估在内的质量控制机制,对标注数据进行统一的存储、版本控制和查询统计等。


图21、22 智能标注子平台
(3)面向离散智造的全解耦数据资源管理技术
构建业务导向的分层解耦架构,借助“云数解耦、存算解耦”策略,将数据从特定计算框架与业务应用中释放,达成对离散制造多模态数据(时序参数、业务元数据、非结构化视频等)的统一标准化管理与智能融合,支撑“采、治、用”一体化的数据价值链,最终以可配置的数据服务驱动业务敏捷创新。
下一步:为工业数据治理、管理、应用等人员提供全栈式全解耦的数据资源管理功能模块,涵盖多源异构数据采集、实时流处理、分布式处理分析和海量数据秒级检索等,实现行业数据的集中汇聚、实时分析、融合关联和深度挖掘。面向离散行业应用,构建多领域数据字典,实现工业数据应用融合、流程贯通、集成共享和价值挖掘,提升数据对业务的赋能能力。

图23 全解耦数据资源管理子平台





资讯频道