标签

智能时代下科学数据的价值与挑战

一、引言:洞悉智能时代科学数据共享的根本逻辑科学数据作为驱动国家科技进步与经济社会发展的关键战略资源,在智能时代更是人工智能的升级迭代和科研模式变革的核心“能量”。自2018年《科学数据管理办法》颁布实施以来,我国在科学数据汇集、管理和共享方面的体系建设取得了长足进步。然而,面对生成式人工智能的迅猛发展及其带来的新需求,深层次的制约因素依然存在,严重阻碍了数据价值的充分释放,并限制了人工智能对科学数据的深度赋能。早期人工智能理论的发展经历了三个主要学派的演进:符号主义、连接主义和行为主义。符号主义强调“机

2026-05-07 02:18:06  |  5 阅读

AI科研卡点:数据还没准备好

又有公司推出新的科学模型,又有机构继续砸下重金,AI 难道真的已经在科研领域大展拳脚了吗?但 DeepMind、Biohub、OpenAI 近期的几项动作,却共同指向一个事实:数据依旧是 AI 科研最明显的短板。DeepMind 在 4 月发布了一份科学数据盘点,选用核聚变和 JET 数据作为样板,指出:许多科学数据虽然已经存在,但目前还不能直接被送入 AI 系统使用。Biohub 在 4 月 29 日宣布 Virtual Biology Initiative,计划用 5 年投入 5 亿美元,内容聚焦在:

2026-05-02 17:30:15  |  7 阅读

周园春:新时代的科学数据工作者

4月21日,国务院新闻办公室举办“新征程上的奋斗者”国际媒体交流会,邀请科技行业代表就“传承科学家精神 推动科技自主创新能力”与中外记者展开对话。中国科学院计算机网络信息中心副主任周园春讲述科学数据领域的工作经历。

2026-04-22 09:17:22  |  8 阅读

AI时代的科学数据共享新范式:FAIR×FAIR框架解读

[目标]本文聚焦人工智能背景下科研数据的开放共享与深度应用难题,针对现行FAIR准则难以有效引导数据实现AI适配的不足,构建了面向智能化应用的科研数据管理原则体系。[路径]通过深入剖析传统机器学习、大型模型预训练、模型微调、检索增强生成及智能体等五类主流AI应用场景的数据诉求,在既有FAIR"四可"准则基础上,创立了面向AI就绪(即For AI Ready)的科研数据共享利用原则架构FAIR×FAIR,并设计了与之匹配的多层次技术体系。[成效]该框架确立了13项支撑科研数据AI适配的技术规范,为消除人工智

2026-04-18 21:43:10  |  6 阅读

πFlow AI 发布:抛弃拖拽操作,一句话完成科研数据处理

从事科研工作的你,是否经常遇到这样的情况?想要清理一批天文数据,必须先拖拽几十个组件、配置大量参数;想要转换格式,又需要从头连接一遍;每次处理新的文件,都要重复相同的拖拽步骤。这并非你的能力问题,而是传统ETL工具太过僵化。如今,中国科学院计算机网络信息中心正式开源发布πFlow AI0.5。它不是一个需要你拖拽几十个组件的流水线工具,而是一个能理解人类语言、自动执行任务、越用越智能的科学数据处理智能工作台。在传统ETL工具中,你要进行数据清洗、转换、分析,通常需要:- 拖拽一个“读取CSV”组件- 再拖

2026-04-16 21:37:01  |  9 阅读