高质量数据集成AI跃升关键支撑
3月1日,第四届北京人工智能产业创新发展大会“AI+数据要素”分论坛在北京国家会议中心举行。论坛以“智汇京西,数聚未来——释放数据要素价值,驱动产业智能跃升”为主题,由北京市门头沟区人民政府、中国电信北京公司、北京邮电大学共同主办。国家数据局、北京市政务服务和数据管理局有关负责人出席并致辞,围绕人工智能与数据要素的深度协同、数据价值转化实现路径等议题展开深入交流。
政企协同 数据要素落子京西
一条京西古道,昔日是京城通往塞外的重要商贸通道;如今的门头沟,正在加快成为数据要素流通的重要节点。
分论坛现场,北京市门头沟区人民政府与中国电信北京公司举行战略合作启动仪式。双方表示,将围绕门头沟区三大产业定位,在新型信息基础设施建设、数据要素价值挖掘、城市安全治理、数字标杆场景四个方面推进深度合作。
这次合作,推动数据要素从论坛讨论走向区域实践。中国电信北京公司将以新型信息基础设施为基础,贯通数据采集、治理、流通、应用全流程,助力门头沟打造“数据输入—智能加工—价值输出”的区域枢纽模式。城市安全治理将进一步释放公共数据价值,数字标杆场景则将探索数据要素市场化配置的现实路径。
当数据要素真正融入区域治理和产业升级的“毛细血管”,门头沟有望成为北京建设全球数字经济标杆城市的重要支点。
“交融”平台 为AI备足“口粮”
“算法决定AI的基础能力,数据质量才决定发展上限。”同样的模型框架,有的训练后表现优异,有的效果平平,关键往往不只在算法本身,而在于模型日常“摄入”的数据质量。
瞄准这一核心问题,中国电信北京公司与中交信科集团牵头,联合山东港口青岛港、中科院计算所、北京邮电大学发布“交融高质量数据集平台”,专注为AI提供优质“口粮”,让机器不仅“吃得饱”,更能“吃得精”。
当前行业面临的现实难题是:数据规模庞大,但真正可直接用于模型训练的高质量数据十分稀缺,“数量大、质量弱、落地难”已成为产业智能化的普遍痛点。针对这一问题,平台提出全栈式解决方案——汇聚行业龙头、数字技术先锋与中试基地标杆三方生态力量,构建覆盖数据采集、治理、加工、质检全生命周期的闭环服务体系。
在技术架构上,平台以多模态融合管理和高精尖算子引擎双轮驱动,前者打通文本、图像、音视频等异构数据之间的壁垒,后者提供智能化处理能力。这意味着,企业无需自建复杂的数据处理流程,也能获得标准化、可直接“投喂”模型的AI-Ready数据集。
目前,该平台已深度支撑多个行业高质量数据集建设先行先试项目,获得国家数据局、国资委及省级荣誉十余项。依托平台生成的高质量数据集,已成功赋能星港、交融等行业级大模型持续迭代升级,落地港口全要素智能调度、安全作业管控等典型场景,精准对接行业个性化数据应用需求,实现数据、模型、场景的深度融合与价值释放。
“只有让AI‘吃’得更好,产业智能才能发展得更强。”中国电信北京公司相关负责人表示,以高质量数据集和智能化治理为核心的基础设施建设,正日益成为推动千行百业数字化转型的重要引擎。
实验室揭牌 聚焦核心攻关
如果说“交融”平台着力解决的是产业智能化的“当务之急”,那么新揭牌的实验室则面向未来,致力于突破更深层次的发展瓶颈。
论坛同期,中国电信北京公司与北京邮电大学联合申报的“多模态数据智能感知与治理北京市重点实验室”正式发布。该实验室已通过2025年北京市重点实验室认定,聚焦人工智能时代数据要素价值化与安全治理的重大需求,为数据要素市场建设和数字经济发展提供底层技术支撑。
实验室明确了四大攻关方向:多模态数据融合理解、智能关联分析、安全管控与可信流通,重点突破异构模态语义鸿沟、时空数据对齐、敏感信息保护、数据价值评估等关键技术难点。
简言之,既要让分散的数据“讲同一种语言”,实现跨模态智能关联;也要在流通过程中做到“放得开、管得住”,平衡价值释放与安全可控。最终目标是构建覆盖数据全生命周期的智能治理与高价值开发利用技术体系,让数据真正由“资源”迈向“资产”。
专家共议 AI与数据相互赋能
国家信息中心大数据发展部数据要素处处长、中国信息协会数据要素专委会执行主任王璟璇,系统阐述了《加快数据要素市场化配置改革,实现AI与数据双向赋能》的顶层设计思路。
中国电信数据发展中心副主任梁天健作了《探索构建高质量数据集到可信流通的价值闭环》相关报告,分享了中国电信在高质量数据集建设方面的核心实践。中国信息通信研究院云计算与大数据研究所副总工程师闫树则系统分析了《高质量数据集建设与运营路径》。
北京邮电大学人工智能生态系统研究所所长彭志文解读了《数据标注的现状与前景》,为数据基础工作提供思路。北京大学教授、人工智能研究院副院长黄罡,中国科学院研究员李凤华等多位权威专家,也围绕AI与数据要素融合发表了深入见解。
理论最终还要走向实践。龙湖集团千丁数科、北京昊睿数创科技、数新智能、青岛檬豆网络、首都信息发展等企业代表,分享了数据要素在垂直行业中的实践案例。
从京西数据枢纽建设,到“交融”平台的产业落地,再到重点实验室的前沿攻关,数据要素价值化的实现路径正变得更加清晰。面向未来,中国电信北京公司将携手多方,打造更加开放、可信、智能的数据要素生态体系,为北京建设全球数字经济标杆城市注入电信力量。当数据真正高效流动起来,数字经济的下一程更值得期待。
