πFlow AI 发布:抛弃拖拽操作,一句话完成科研数据处理
从事科研工作的你,是否经常遇到这样的情况?
想要清理一批天文数据,必须先拖拽几十个组件、配置大量参数;
想要转换格式,又需要从头连接一遍;
每次处理新的文件,都要重复相同的拖拽步骤。
这并非你的能力问题,而是传统ETL工具太过僵化。如今,中国科学院计算机网络信息中心正式开源发布πFlow AI0.5。
它不是一个需要你拖拽几十个组件的流水线工具,而是一个能理解人类语言、自动执行任务、越用越智能的科学数据处理智能工作台。
在传统ETL工具中,你要进行数据清洗、转换、分析,通常需要:
- 拖拽一个“读取CSV”组件
- 再拖拽一个“字段映射”
- 再连接一个“条件过滤”
- 再配置大量正则表达式
- ……
现在,你只需说出:
“帮我清理这个CSV文件,去除空行,把日期统一成YYYY-MM-DD格式,然后按时间排序。”
πFlow AI 会自动完成:
1. 理解你的需求
2. 匹配相应的技能
3. 生成可执行的DAG流程图
4. 执行完毕返回结果文件
全程无需拖拽,无需编写代码。更加关键的是,它支持多步骤流水线自动编排:
你一次性说出多个需求(例如“先清理,再提取表格,最后生成摘要”),系统会自动关联对应的技能,一气呵成完成,无需分三次提问。
πFlow AI 目前内置了106 个科学数据处理技能,覆盖范围包括:
- 数据清洗、校验、去重
- 格式转换、标准化
- 过滤筛选、数据增强
- 流程控制、输入、输出
未来还可以自定义新技能,让平台越来越契合你的研究习惯。
对话式交互界面(人说话,AI干活):
自动生成的DAG流程图(流程清晰可视):
技能库管理(积累的经验一目了然):
πFlow AI 并不是要取代你,而是要把那些重复、繁琐、不创造价值的数据处理工作,全部交给AI负责。
你只需要负责提出问题、确定方向,它负责智能编排、自动处理,让你把时间真正投入到研究本身。
开源社区正在建设中,欢迎开发者、科研人员、学生加入。一起打造国内一流的大数据处理与智能分析生态。