标签

昆仑万维方汉:AI智能体从"能说会道"迈向"实干兴邦"

发布时间:2026-07-01 11:51阅读:3

倘若说前些年人工智能最核心的进展,是让机器掌握理解与生成语言的能力,那么如今最关键的变革,则是让AI真正投身到实际工作之中。

本期受访嘉宾:昆仑万维董事长兼CEO方汉

近期,AI领域掀起一股智能体密集落地浪潮。

字节跳动、阿里云、腾讯云等国内互联网巨头相继推出企业级AI Agent平台,将智能体从技术构想推向真实业务场景;国际市场,领先厂商同样加快Agent能力的产品化进程。Claude推出"群聊Agent"功能,AI助手正式以"同事"身份入驻工作群组。

密集动作背后,信号已然明确,AI智能体不再止步于对话交互,而是正深度融入实际工作流。

2026年被业界广泛认定为"AI Agent元年",行业讨论重心也从"模型智商高低"转向"究竟能创造多少实际价值"。

今年5月,昆仑万维天工AI重磅发布智能体模型SkyClaw-v1.0,同步上线轻量版本,兼顾企业专业需求与个人日常应用。

SkyClaw是什么?通俗而言,聊天AI是你提问它回答,SkyClaw是你吩咐它执行。

当下,DeepSeek、Claude、Qwen等通用模型已相当强大,为何业界仍需专门的"Agent模型"?

对此,方汉打了个精妙的比方:"通用模型如同百科全书,Agent模型更像熟练工匠。前者胜在见多识广,后者强在踏实可靠。"在他看来,目前多数通用大模型,本质上仍是"问答模型"——用户输入问题,它输出答案。但真实职场绝非"一问一答"这般简单。

方汉指出当前大模型普遍存在的痛点,"诸多模型演示时看似神通广大,一旦置于真实生产环境便频频失误。原因在于训练阶段,并未针对'多轮任务+工具调用+超长上下文'这类复杂场景进行专项优化。"

SkyClaw-v1.0重点攻克的,正是这些难题。

首要的是"长记忆"。诸多模型对话一久,便容易"遗忘前文内容"。而SkyClaw支持百万token上下文,能够驾驭超长文本理解。方汉举例说明:"相当于它能一次性读完《三体》三部曲,还能牢记其中每个细节。"

其次,是复杂工具调用能力。真实业务中,一项任务往往需同时调用十余种工具,还可能遭遇异常、报错、信息缺失等状况。而SkyClaw要做的不仅是"提建议",而是真正将任务推进到底。

三是持续执行能力。SkyClaw可运行于OpenClaw、Hermes、Codex等主流Agent框架,兼容多种环境,真正做到"部署即可持续运转"。

为让大众更直观感受智能体的变革,方汉列举了一个开发者场景。

以往,程序员若想编写网页爬虫,需向AI索要代码、复制代码、本地运行、遇到报错、再将错误反馈AI、AI修正、再次运行,反复折腾多次。

而今,借助SkyClaw,开发者只需一句指令:"帮我抓取某网站新闻标题与发布日期,存入数据库,并生成Markdown表格。"

随后,这位AI助理便会自动完成全流程,整个过程无需开发者手动复制、粘贴、调试,模型自主完成多轮迭代。

在方汉眼中,真正高效的人机协作理应如此。模型承担执行任务,人类负责判断与创造。但这并非意味着程序员将失业,而是能从大量重复劳动中解放,将精力倾注于更复杂、更具创造性的事务。

方汉进一步说明,这一逻辑同样适用于短剧平台,昔日剪辑万条广告素材需十几人耗费整日,如今将一部短剧交给Agent,数小时内即可自主完成分镜、筛选精彩片段、自动剪辑、添加字幕、输出素材等整套操作。

此前,昆仑万维发布"4+3"战略——四大SOTA模型(视频、音乐音频、世界模型、文本多模态)支撑三大AI原生平台(AI短剧、AI音乐、AI游戏)。方汉将四大SOTA模型比作不同工种,有的擅长绘画、有的精于谱曲、有的负责生成游戏场景。但若要完成复杂任务,便需一位"项目经理"统筹协调各环节。

如今,SkyClaw正是这位"项目经理"。它负责理解用户需求、拆解任务步骤、调度不同模型、处理输出结果,并持续优化调整,直至最终交付完整成果。

方汉表示:"专业模型负责'会做某件事',Agent模型负责'把事做圆满'。"他强调,智能体并非取代其他模型,而是让整个AI系统真正形成协同。

今年以来,"一人公司"成为创业圈热词,越来越多的"一人公司"正在涌现。

何谓一人公司?即一个人,借助一组Agent,完成过去需整支团队方能胜任的工作。独立开发者往昔需亲自操刀代码、设计、文案、推广、客服。而未来,这些环节均可由不同Agent分担。人真正需要做的,仅剩:明确目标、设计流程、关键决策。

"高性能、低成本的Agent模型,正在加速这一进程。"方汉指出,高性能意味着它能处理复杂任务,而非仅在简单场景中"玩具式"运行;低成本意味着规模化调用在经济层面切实可行。

方汉预判,未来3年,普通知识工作者每日将与少则十余个、多则数十个Agent协作。它们未必都以"对话机器人"形态现身,更多将在后台静默运作。例如,邮件Agent自动筛选分类并草拟回复,日程Agent自动协调会议时间,数据分析Agent每日清晨下载最新报表并生成摘要,知识管理Agent自动整理阅读过的文章笔记并在需要时精准检索。"你甚至察觉不到它们的存在,但工作效率将提升一个量级。"

2026年,政府工作报告首次提出"打造智能经济新形态",并明确深化拓展"人工智能+",促进新一代智能终端和智能体加快推广,推动重点行业领域人工智能商业化规模化应用,培育智能原生新业态新模式。2026年4月,工业和信息化部办公厅、国家数据局综合司联合印发《关于联合实施2026年"模数共振"行动的通知》,正式启动"模数共振"行动,推动人工智能模型与数据资源协同互促,助力人工智能高水平赋能新型工业化发展。

方汉认为,这对整个行业最大的价值,在于"场景开放速度将显著加快"。过去,AI智能体进入政务、金融、工业、科研等领域,最大难点并非完全在于技术,而是信任成本与系统接入成本。而当"智能体"上升为国家战略后,诸多行业的采购决策链将明显缩短。"大家会更积极尝试,也更愿意开放真实场景。"方汉说道。

目前,昆仑万维正推进两项工作,一是通过免费试用,加速开发者生态构建;二是持续适配Claude Code、Codex、Hermes等主流Agent框架。

在方汉看来,未来真正的较量,不再只是"谁的模型更会聊天",而是谁能真正嵌入工作流、完成真实任务。

而谈及对未来AI产品模式的探索方向,方汉表示,他最看好的是"AI原生平台经济"方向。他阐释道,过去的内容平台是"人创作、AI推荐",未来将是"AI辅助创作、AI辅助分发、AI辅助变现",创作者只需提供创意与判断。这一点目前在AI短剧与AI音乐平台上已见雏形,一个不懂剪辑的人,通过AI即可生成完整短剧,从拍摄、配乐到发布一气呵成。

未来,昆仑万维将在三个维度持续突破,一是让三大AI原生平台全面Agent化,让人从"操作软件"转变为"指挥Agent";二是将Skywork打造为"个人超级智能体操作系统",统一管理邮件、日程、代码、笔记、文档等数字工作;三是探索"智能体市场",开发者可基于SkyClaw构建各类专业Agent,用户按需订阅,形成繁荣生态。

方汉以一句话描绘智能体时代蓝图:"未来,每个人都将拥有由数十个Agent组成的'数字员工团队'。AI不再是工具,而是真正的协作伙伴。"