法律AI一周速览:Claude强势入局;OpenAI架构调整...... | 行业动态(5.12-17日)
梳理各类工具与能力,筛选出核心信息与关键趋势,帮助法律从业者更高效地把握行业动向、发现实用工具,并准确评估其在实际工作中的适用性和局限性。
重点资讯
5月5日,ChatGPT 默认模型悄然更换为 GPT-5.5 Instant。
最直观的体验是:AI 终于不再胡说八道了。幻觉率最高降低 52.5%,高风险领域不准确声明减少 37.3%。这意味着什么?AI 正在从“答非所问”进化到“说人话”。
Anthropic 的预测:到今年底,四成企业应用会直接集成任务型 AI 智能体。从问答助手到任务执行者,这个转型比你想象的快。
本周最热门的 15 个项目,超过一半都跟 Claude Code 有关联。
Karpathy 的 CLAUDE.md 文件被 fork 了 12 万次。everything-claude-code 项目突破 18 万星。
AI 编程的竞争已经不在模型本身,而在整个工具链和生态系统。
5月16日,Anthropic 发布 12 个法律专业插件,覆盖商业、隐私、雇佣、治理、监管、企业诉讼、知识产权等领域。
与汤森路透合作,基于 MCP 开放标准,IT 和安全团队可以实现集中管控。Claude 深度集成 Microsoft 365,Word/Excel/PowerPoint 全部支持。
对非营利组织还有折扣定价。法律工具不再是大型律所的专属。
CES 2026 上,NVIDIA 推出了 Rubin 平台。
核心数据:推理 token 成本是 Blackwell 的十分之一,MoE 模型训练只需要四分之一的 GPU,Spectrum-X 以太网交换机能效提升 5 倍。
微软 Azure AI 超级工厂已经订购数十万 Rubin 芯片。这不只是成本降低,这是 AI 基础设施即将大规模普及的信号。
karpathy-skills 一周突破 10 万星,mattpocock/skills 达到 6 万+。
简单来说:MCP 解决“工具怎么连”,Skills 解决“任务怎么做”。从协议层到实现层,AI 正在变得更接地气。
Claude for Legal 的启示
Claude for Legal 的启示,并不是直接照搬一套英美法语境下的法律 AI 工具。中国法律体系在法律渊源、司法裁判逻辑、行政监管方式、合同实务习惯、执行程序、底层数据沉淀等方面都有自己的特点。
因此,更合适的路径是:借鉴 Claude for Legal 的产品组织思路,构建一套适配中国法律实务的智能工作流。
在工具选择上,也不必只把 AI 当作一个聊天窗口,而应区分不同层级的能力:
具体举例而言,目前的WorkBuddy是一个不错的平台,具有极高的灵活性,例如WorkBuddy+企查查 MCP工作流,它不是单纯问答,而是把外部数据源、法律任务指令、专用 Agent 和业务流程连接起来。
因此,真正要学习的不是 Claude for Legal 的具体法律内容,而是它的组织方式:把法律工作拆成清晰场景,把经验封装成可复用指令,把外部数据接入工作流,再用专用 Agent 执行具体任务。沿着这个方向,WorkBuddy 可以逐步发展成一套更适合中国法律实务的智能化工作平台。
Skills 是一套完整的 AI 使用指南,包含教学路径、示例代码、最佳实践。
跟 MCP 的区别:MCP 是协议,Skills 是实现;MCP 回答“怎么调用”,Skills 回答“怎么完成”。
演进路线:2024 年手工写 Prompt → 2025 年 MCP 协议标准化 → 2026 年 Skills 封装跨平台复用。
(2)agent-deep-research(深度研究智能体):自主搜索、多源整合、结构化报告生成,支持本地文件 RAG 锚定。适合投研分析、竞品调研、学术研究、架构评估。
(3)ecommerce-skills(电商技能库):覆盖 Amazon、Shopify、Etsy、TikTok Shop 全平台。适合产品研究、营销自动化、供应链优化、商业分析。
(4)微信读书 Skill:批量拉取书籍笔记和标注,作为知识库素材。
安装:cdn.weread.qq.com/skills/weread-skills.zip。
(2)腾讯云 Agent Memory:Token 省 61%。核心技术是上下文卸载 + Mermaid 任务画布,解决长任务中上下文窗口易满、Token 成本高的问题。
(3)Codex 钩子系统:在任务关键节点运行自定义脚本,可以做工作验证、扫描密钥、记录日志。实操场景:Agent 帮你查企查查后,自动触发法条校验和格式检查。
(4)Kimi 网页桥接浏览器扩展:Agent 可以像人一样搜索、滚动、点击、输入。做法律调研时,Agent 可自动遍历网页上的司法数据。
(5)Codex 手机端可用:ChatGPT 手机 App 里直接用,出差途中也能跟进 AI 工作流。
ChatGPT、Codex、API 三大产品线合并为统一组织。Greg Brockman 全面接管产品战略,成为实际掌权者。三大产品线合并,意味着更好的产品协同。
Mustafa Suleyman 预测 AI 将在 18 个月内实现人类水平的性能,自动化大多数专业任务,包括法律、会计、营销、项目管理——所有坐在电脑前的白领工作。
Anthropic 在 GitHub 开源了专为法律领域优化的 AI 模型,更准确处理法律文本、合同、案例摘要。开源可自部署。
研究 anthropics/claude-for-legal 这个 repo 的 prompt 设计思路,可以优化自己的法律相关 Skills。
Bloomberg 报道:美国 AI 相关岗位出现大规模裁员。AI 对劳动力市场的冲击从理论进入现实。
本周趋势总结
1. Skills 成为AI工作流新标准
Karpathy 和 Matt Pocock 两位顶级 KOL 同时押注。Skills 正在取代 MCP 成为新范式。从“模型能力”竞争转向“生态整合”竞争。
2. Claude Code 生态全面爆发
自我进化能力成熟(hermes-agent)。企业级多 Agent 编排(Ruflo/Claude Flow)。AI 编程从“帮我补”升级为“帮我做完”。
3. 推理成本革命性降低
NVIDIA Rubin 平台推理成本降至十分之一。OpenSquilla 智能路由再降十倍。算力从“扩张期”进入“精细化运营阶段”。
本节内容选自「法律智能体设计师(LAD)知识库」,它的核心是一套法律业务与 AI 融合的完整体系——从认知,到方法,到真正可以上手的落地路径。
知识库具体介绍详见:《法律智能体设计师(LAD)知识库》正式上线
知识库核心内容「法律智能体设计师(LAD)实训手册」为付费订阅内容,订阅费用99元/年。
订阅知识库请添加知识库负责人微信开通权限。
订阅后,以下内容同步可见,无需额外付费。