标签

πFlow AI 发布:抛弃拖拽操作,一句话完成科研数据处理

发布时间:2026-04-16 21:37来源:微信阅读:10

从事科研工作的你,是否经常遇到这样的情况?

想要清理一批天文数据,必须先拖拽几十个组件、配置大量参数;

想要转换格式,又需要从头连接一遍;

每次处理新的文件,都要重复相同的拖拽步骤。

这并非你的能力问题,而是传统ETL工具太过僵化。如今,中国科学院计算机网络信息中心正式开源发布πFlow AI0.5。

它不是一个需要你拖拽几十个组件的流水线工具,而是一个能理解人类语言、自动执行任务、越用越智能的科学数据处理智能工作台。

在传统ETL工具中,你要进行数据清洗、转换、分析,通常需要:

- 拖拽一个“读取CSV”组件

- 再拖拽一个“字段映射”

- 再连接一个“条件过滤”

- 再配置大量正则表达式

- ……

现在,你只需说出:

“帮我清理这个CSV文件,去除空行,把日期统一成YYYY-MM-DD格式,然后按时间排序。”

πFlow AI 会自动完成:

1. 理解你的需求

2. 匹配相应的技能

3. 生成可执行的DAG流程图

4. 执行完毕返回结果文件

全程无需拖拽,无需编写代码。更加关键的是,它支持多步骤流水线自动编排:

你一次性说出多个需求(例如“先清理,再提取表格,最后生成摘要”),系统会自动关联对应的技能,一气呵成完成,无需分三次提问。

πFlow AI 目前内置了106 个科学数据处理技能,覆盖范围包括:

- 数据清洗、校验、去重

- 格式转换、标准化

- 过滤筛选、数据增强

- 流程控制、输入、输出

未来还可以自定义新技能,让平台越来越契合你的研究习惯。

对话式交互界面(人说话,AI干活):

自动生成的DAG流程图(流程清晰可视):

技能库管理(积累的经验一目了然):

πFlow AI 并不是要取代你,而是要把那些重复、繁琐、不创造价值的数据处理工作,全部交给AI负责。

你只需要负责提出问题、确定方向,它负责智能编排、自动处理,让你把时间真正投入到研究本身。

开源社区正在建设中,欢迎开发者、科研人员、学生加入。一起打造国内一流的大数据处理与智能分析生态。