标签

AI的局限性与Agent Skill的稳定性保障

无论是LLM(大语言模型)还是CNN(卷积神经网络),它们均属于神经网络范畴,核心在于概率统计与函数逼近(拟合)。因此,防止其“发疯”至关重要,尽管这听起来像玩笑。在实际应用中,我们必须规避或预估AI输出的不确定性。鉴于不同行业对确定性的诉求各异,AI的落地难度与进度自然参差不齐。在处理多步骤流程自动化时,绝不能当甩手掌柜,必须布设监控节点以捕捉异常并纠错。试想,若某流程需5个AI决策,单点准确率虽达90%,但最终准确率恐不足60%。故而,Agent引入Skill的核心价值在于确保结果的稳健性,并对AI的

2026-06-06 22:25:35  |  2 阅读

广深双地联动,AI赋能增效:总部专项培训圆满收官

2026广深总部AI增效特训完美落幕中国·广州|深圳在人工智能技术飞速演进的时代,我们的核心关切在于:如何让智能体切实赋能工作,而非仅止步于对话交互。5月27日于广州总部联合国会议室、6月1日于深圳总部银河厅,两场AI智能体专项培训相继成功举办,广深两地同仁齐聚,共同启程“AI增效”的实战征途!本次特训特邀数字化顾问关老师担纲主讲,为广深两地员工呈现前沿且实用的AI课程。广深两地,分场同步推进鉴于地域差异与实操需求,培训分设广州、深圳两场独立进行。虽时间相隔数日,但两地学员的学习热情同样高涨,现场氛围热烈

2026-06-04 18:42:33  |  1 阅读

【报名】工信部吴迪导师:构建数字员工矩阵与Skill技能注入

历经前三讲关于认知突破、内容升级及数据维度的深入探讨,我们已助力众多职场人士与企业将AI技术成功落地于实际业务场景。本次课程,我们将迈入更为高阶且系统的阶段——聚焦于数字员工矩阵的构建与Skill框架的开发应用。6月16日(周二)19:00-21:00,我们荣幸邀请到工信人才大数据产业人才基地AI导师、中国精英讲师联合会会长、畅销书《DeepSeek掘金》副主编吴迪老师,带来系列第四讲:《数字员工矩阵及Skill框架的开发》。01为何本次课程值得重点关注?众多企业在尝试利用AI提升效率时,所遭遇的瓶颈往往

2026-06-04 14:54:28  |  3 阅读

AI编程时代如何避免管理误区

token不是绩效指标,skill不能替代员工,AI开发也并非年轻人专属AI辅助编程兴起后,许多团队开始探索新的管理方法。这是必然趋势。工具变革生产模式时,管理者总会思考:·谁掌握工具更熟练?·产出效率是否提升?·资源是否存在浪费?·团队能力是否发生变化?但此时最容易误判指标。一些观点听起来新颖,实则只是旧问题的变体。例如:·谁使用token多,谁就更擅长AI·将资深员工经验转化为skill,就能取代他们·AI开发更适合年轻人,老工程师优势将丧失这些观点的误区在于,将AI开发等同于"生成更多内容"。但关键

2026-06-03 19:38:53  |  6 阅读
360报告:Skill成AI智能体安全新隐患

360报告:Skill成AI智能体安全新隐患

近日,360 AI安全研究院推出了《AI安全系列报告:智能体安全新范式——当AI有了“手和脚”,企业安全边界必须重建》(简称《报告》)。《报告》强调,随着智能体迅速渗透到企业办公、研发、运维、客服等关键业务场景,AI安全的核心议题已由“生成风险”转变为“执行风险”。 过去,大模型的安全主要聚焦于AI会不会“说错话”,诸如幻觉、违规输出及敏感信息泄露等问题。然而,当智能体开始调用工具、访问数据并执行实际任务时,其带来的最大隐患正转变为“做错事”。 《报告》提出了“合法动作的非法后果”这一概念,旨在描述智能体

2026-06-02 09:01:36  |  7 阅读

告别 MCP:AI Agent 为何重新拥抱命令行

2024 年底,MCP 协议横空出世。其宏愿是让 AI 能够连通各类外部工具,无论是代码托管、项目管理还是文档协作,统统打通。媒体戏称其为“AI 世界的 USB-C”。听起来很美好。一个接口统御所有工具,就像 USB-C 统一了充电线一样。然而一年半过去,真正高频使用的开发者心态变了。并非 MCP 无用,而是其实际效能与宣传大相径庭。本文将剖析 MCP 的痛点,并解释为何众多人回归一种更古老、更纯粹的路径——命令行。在探讨问题前,需先厘清几个概念。不懂技术的读者可略过,文中后续会解释。LLM:即 Chat

2026-05-30 16:21:26  |  9 阅读

AI Agent 光学设计:Skill 自动解析专利并输出 Excel 报告

往期回顾:open code 结合 Zemax 实现 AI 单片物镜自动设计在人工智能尚未普及的年代,光学工程师若要下载全公司专利并提取数据制成表格,过程极为繁琐;而在 AI 时代,借助 AI Agent 智能体,过去耗时一整天的任务如今仅需十分钟即可搞定。本人编程功底尚浅,若有谬误之处,望各位专家海涵。我对 Skill 的理解如下:Skill:记录操作流程,当后续出现相关指令时自动调用。Skill 存储位置:本案例前置要求:1. 搭建 Python 环境,推荐使用 DeepSeek V4 Pro 或性能

2026-05-28 10:05:56  |  6 阅读

别让AI沦为“百度Plus”,打造团队自动化资产库

你催团队“用AI”,结果发现大家只会润色邮件、起标题、翻文档。AI难道只是个高级版的百度?团队里若没了那个AI高手,他的那一套招数也就断了。钱花了、人练了,最后却没留下任何沉淀。本期为你带来一套实战方案,助你沉淀出团队可永久复用的“AI资产库”!破局核心在于:让AI学会执行你的业务流程核心在于:把公司的业务流程封装成AI能执行的标准化“Skill”,再通过“Agent”串联成全自动工作流。这不仅是概念——Skill就是一份AI能读懂的SOP,Agent就是一个不知疲倦的数字员工。三节课实战课《在Claud

2026-05-27 15:36:59  |  13 阅读
360发布智能体安全白皮书:Skill成风险新入口

360发布智能体安全白皮书:Skill成风险新入口

近日,360 AI安全研究院推出了《AI安全系列报告:智能体安全新范式——当AI有了“手和脚”,企业安全边界必须重建》(简称《报告》)。报告强调,随着智能体快速进入企业办公、研发、运维、客服等关键业务领域,AI安全的核心矛盾正由“生成风险”向“执行风险”转变。 过去,大模型安全主要聚焦于AI是否会“说错话”,比如出现幻觉、违规输文或泄露敏感信息。然而,当智能体开始调用工具、访问数据并执行真实任务时,其最大的风险正逐渐演变为“做错事”。 报告提出了“合法动作的非法后果”这一概念,用来刻画智能体在身份、工具及

2026-05-25 17:29:04  |  6 阅读

打造生产级Coding CLI:AI编程实战全攻略

2026年,Coding CLI 实现了从聊天机器人到高效编程引擎的蜕变。它使LLM能够自主规划、操作文件、运行命令及提交代码,真正将AI转化为生产力工具。掌握AI编程已逐渐成为互联网从业者的必备技能,但驾驭Coding CLI同样需要深入理解。本文系列将深入探讨如何打造生产级Coding CLI,助您的项目从Demo升级为成熟的可用框架。二、Coding CLI 的“质量衰退”及其根源虽然在简单场景下Coding CLI表现卓越,但存在一个致命规律:随着项目复杂度的增加,编程质量会显著下降。编写独立函数

2026-05-24 23:01:11  |  6 阅读

真正的高手,都在用AI构建自己的系统

我迅速给出了我的评估,并强调这个结论并非仅凭直觉得出,而是"人工分析 + AI 协助"的综合产出。随后他追问道:你平常如何"培养"AI?这个问题触及了核心。当前AI应用呈现明显分化:部分人仅将其作为对话工具。部分人用它辅助文字创作。少数人则开始构建AI驱动的工作框架。这三个层次存在本质差异。若仅在对话框中随意提问、临时求助AI完成零散任务——撰写片段、润色文档、概括要点、拟定计划——这当然属于AI应用范畴。然而这并不等同于真正驾驭了AI。因为这种模式本质上属于"即时查询"。虽然能应对眼前需求,却未能构建可

2026-05-24 21:56:16  |  5 阅读

【AI工具】MattPocock Skills开源项目深度体验

— 一粒黑子 · 落子AI新世界 —腾讯10+年程序员5月GitHub最火爆的AI开源项目是什么? 答案不是某个大模型,而是Matt Pocock开源的「skills」项目——专门给Claude Code用的工程师技能库。 上线不到一个月,新增72,000+ Stars,直接冲上Trending榜首。 作为腾讯写了10年代码的老程序员,我实测了一周,今天把真实体验摊开说。一、为什么这个项目突然爆火?先说个背景:2026年5月,GitHub Trending月度榜出现了一个有意思的现象——Claude Sk

2026-05-20 10:12:23  |  7 阅读
谷歌Gemini Spark亮相:重新定义全天候AI私人助理

谷歌Gemini Spark亮相:重新定义全天候AI私人助理

在Google I/O 2026开发者大会上,谷歌Labs产品负责人伍德沃德(Josh Woodward)登台展示了这样一个场景:派对邀请发送完毕后,Gemini Spark自动检索收件箱,将所有回复整合到Google Sheet中,并对未回复者发送提醒邮件。整个流程在后台静默执行,用户无需任何操作。这正是谷歌对Gemini Spark的定位——它不是传统意义上的聊天机器人,而是一位全天候在线的数字助理,主动帮用户完成各类事务。 Spark的核心能力在于跨平台的深度协同。它同时访问Gmail、Google

2026-05-20 02:15:09  |  6 阅读

法律AI一周速览:Claude强势入局;OpenAI架构调整...... | 行业动态(5.12-17日)

梳理各类工具与能力,筛选出核心信息与关键趋势,帮助法律从业者更高效地把握行业动向、发现实用工具,并准确评估其在实际工作中的适用性和局限性。重点资讯5月5日,ChatGPT 默认模型悄然更换为 GPT-5.5 Instant。最直观的体验是:AI 终于不再胡说八道了。幻觉率最高降低 52.5%,高风险领域不准确声明减少 37.3%。这意味着什么?AI 正在从“答非所问”进化到“说人话”。Anthropic 的预测:到今年底,四成企业应用会直接集成任务型 AI 智能体。从问答助手到任务执行者,这个转型比你想象

2026-05-19 19:34:11  |  6 阅读
高德推出空间智能平台与开发者技能体系

高德推出空间智能平台与开发者技能体系

新浪科技讯 5月15日下午消息,高德开放平台发布最新产品——空间智能开放平台、面向广大用户(开发者、企业、创作者)的SKILL体系,以及相关AI产品矩阵。 据介绍,通过空间智能开放平台,用户可以自然语言描述需求,无需编写任何代码,即可便捷调用高德各类前沿空间智能服务。高德开放平台总经理崔勇表示:“过去的开发者合作,需走传统的API/SDK路径:编写代码、整理数据、调试部署。现在我们希望通过高德空间智能开放平台,实现‘沟通即接入’,持续降低技术门槛,服务更多行业场景。” 除自然语言交互外,空间智能开放平台还

2026-05-15 22:43:38  |  11 阅读