新华“太湖对话”首期思享汇 | 汪睿棋:标准引领数据赋能,筑牢“AI+制造”发展基石
汪睿棋就“人工智能+制造”中的数据堵点与高质量数据集建设分享了专业见解。他指出,人工智能赋能制造业的核心难点在于让AI真正理解工业场景、机理与设备操作状态,而最基础的支撑正是数据。
新华财经北京6月6日电(杨扬)5日,以“智融百业 锡引未来”为主题的新华“太湖对话”(第四期)高端访谈暨首期思享汇活动在江苏无锡举行。活动同期举办以“从‘制’高点跃向‘智’高点——无锡‘AI+制造’融合发展路径探析”为主题的圆桌对话。中国电子技术标准化研究院数据研究室技术总监汪睿棋就“人工智能+制造”中的数据堵点与高质量数据集建设分享了专业见解。他指出,人工智能赋能制造业的核心难点在于让AI真正理解工业场景、机理与设备操作状态,而最基础的支撑正是数据。
汪睿棋认为,当前我国工业数据领域存在三大痛点:数据质量参差不齐、数据流通意愿不足、面向AI模型训练的高质量数据集标准缺失。他提出,要筑牢工业数据基础,必须从标准引领、可信流通与高质量数据集建设三方面发力。
汪睿棋强调,要发挥标准的引领带动作用,通过标准统一高质量数据集建设指南、格式和分类等管理规范以及质量测评指标方法,才能提升数据跨系统、跨企业、跨行业复用能力。前期,在国家数据局的指导下,全国数标委秘书处中国电子技术标准化研究院正式发布了高质量数据集4项技术文件,并已同步国家标准立项,分别是《高质量数据集 建设指南》《高质量数据集 格式要求》《高质量数据集 分类指南》《高质量数据集 质量测评规范》,为高质量数据集测评提供了权威依据。同时依托电子信息产品标准化国家工程研究中心成立“工业数据发展创新联合体”,围绕工业数据领域加快标准研制。他建议无锡龙头企业积极参与国家标准乃至国际标准的制定,积极贡献“无锡方案”。
针对企业“不愿、不敢、不能”共享数据的困境,汪睿棋表示,国家数据局正在推动可信数据空间建设。基于国家标准建设产业链上下游的可信数据空间,可以在保障安全的前提下实现数据高效流通,让数据真正服务于模型训练和管理提升。
汪睿棋指出,不能只重视数据规模而忽视应用价值。高质量数据集需要通过标准手段建立统一标杆,并依托标准化的“数据质量验证+模型应用反馈”方法来检验数据集对模型能力的提升效果。下一步,工业数据工作应实现三个转变:一是从“有没有数据”转向“有没有高质量数据”,二是从单个企业用数转向产业链协同用数,三是从数据治理转向数据、模型、场景一体化迭代。
据了解,新华“太湖对话”高端访谈是由中国经济信息社与无锡市委宣传部联合打造的高端交流合作平台,至今已举办四期,依托中国经济信息社专业的智库团队及丰富的专家资源,助力无锡引进高端智慧、集聚创新资源、促进项目对接。
编辑:冯蕊
版权声明:未经新华财经书面授权许可,严禁任何个人或机构以任何形式复制、引用本文内容或观点。
免责声明:新华财经(中国金融信息网)为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115











