πFlow AI 发布:抛弃拖拽操作,一句话完成科研数据处理

发布时间：2026-04-16 21:37阅读：17

从事科研工作的你，是否经常遇到这样的情况？

想要清理一批天文数据，必须先拖拽几十个组件、配置大量参数；

想要转换格式，又需要从头连接一遍；

每次处理新的文件，都要重复相同的拖拽步骤。

这并非你的能力问题，而是传统ETL工具太过僵化。如今，中国科学院计算机网络信息中心正式开源发布πFlow AI0.5。

它不是一个需要你拖拽几十个组件的流水线工具，而是一个能理解人类语言、自动执行任务、越用越智能的科学数据处理智能工作台。

在传统ETL工具中，你要进行数据清洗、转换、分析，通常需要：

- 拖拽一个“读取CSV”组件

- 再拖拽一个“字段映射”

- 再连接一个“条件过滤”

- 再配置大量正则表达式

- ……

现在，你只需说出：

“帮我清理这个CSV文件，去除空行，把日期统一成YYYY-MM-DD格式，然后按时间排序。”

πFlow AI 会自动完成：

1. 理解你的需求

2. 匹配相应的技能

3. 生成可执行的DAG流程图

4. 执行完毕返回结果文件

全程无需拖拽，无需编写代码。更加关键的是，它支持多步骤流水线自动编排：

你一次性说出多个需求（例如“先清理，再提取表格，最后生成摘要”），系统会自动关联对应的技能，一气呵成完成，无需分三次提问。

πFlow AI 目前内置了106 个科学数据处理技能，覆盖范围包括：

- 数据清洗、校验、去重

- 格式转换、标准化

- 过滤筛选、数据增强

- 流程控制、输入、输出

未来还可以自定义新技能，让平台越来越契合你的研究习惯。

对话式交互界面（人说话，AI干活）：

自动生成的DAG流程图（流程清晰可视）：

技能库管理（积累的经验一目了然）：

πFlow AI 并不是要取代你，而是要把那些重复、繁琐、不创造价值的数据处理工作，全部交给AI负责。

你只需要负责提出问题、确定方向，它负责智能编排、自动处理，让你把时间真正投入到研究本身。

开源社区正在建设中，欢迎开发者、科研人员、学生加入。一起打造国内一流的大数据处理与智能分析生态。