标签

法律AI一周速览:Claude强势入局;OpenAI架构调整...... | 行业动态(5.12-17日)

发布时间:2026-05-19 19:34来源:微信阅读:6

梳理各类工具与能力,筛选出核心信息与关键趋势,帮助法律从业者更高效地把握行业动向、发现实用工具,并准确评估其在实际工作中的适用性和局限性。

重点资讯

5月5日,ChatGPT 默认模型悄然更换为 GPT-5.5 Instant。

最直观的体验是:AI 终于不再胡说八道了。幻觉率最高降低 52.5%,高风险领域不准确声明减少 37.3%。这意味着什么?AI 正在从“答非所问”进化到“说人话”。

Anthropic 的预测:到今年底,四成企业应用会直接集成任务型 AI 智能体。从问答助手到任务执行者,这个转型比你想象的快。

本周最热门的 15 个项目,超过一半都跟 Claude Code 有关联。

Karpathy 的 CLAUDE.md 文件被 fork 了 12 万次。everything-claude-code 项目突破 18 万星。

AI 编程的竞争已经不在模型本身,而在整个工具链和生态系统。

5月16日,Anthropic 发布 12 个法律专业插件,覆盖商业、隐私、雇佣、治理、监管、企业诉讼、知识产权等领域。

与汤森路透合作,基于 MCP 开放标准,IT 和安全团队可以实现集中管控。Claude 深度集成 Microsoft 365,Word/Excel/PowerPoint 全部支持。

对非营利组织还有折扣定价。法律工具不再是大型律所的专属。

CES 2026 上,NVIDIA 推出了 Rubin 平台。

核心数据:推理 token 成本是 Blackwell 的十分之一,MoE 模型训练只需要四分之一的 GPU,Spectrum-X 以太网交换机能效提升 5 倍。

微软 Azure AI 超级工厂已经订购数十万 Rubin 芯片。这不只是成本降低,这是 AI 基础设施即将大规模普及的信号。

karpathy-skills 一周突破 10 万星,mattpocock/skills 达到 6 万+。

简单来说:MCP 解决“工具怎么连”,Skills 解决“任务怎么做”。从协议层到实现层,AI 正在变得更接地气。

Claude for Legal 的启示

Claude for Legal 的启示,并不是直接照搬一套英美法语境下的法律 AI 工具。中国法律体系在法律渊源、司法裁判逻辑、行政监管方式、合同实务习惯、执行程序、底层数据沉淀等方面都有自己的特点。

因此,更合适的路径是:借鉴 Claude for Legal 的产品组织思路,构建一套适配中国法律实务的智能工作流。

在工具选择上,也不必只把 AI 当作一个聊天窗口,而应区分不同层级的能力:

具体举例而言,目前的WorkBuddy是一个不错的平台,具有极高的灵活性,例如WorkBuddy+企查查 MCP工作流,它不是单纯问答,而是把外部数据源、法律任务指令、专用 Agent 和业务流程连接起来。

因此,真正要学习的不是 Claude for Legal 的具体法律内容,而是它的组织方式:把法律工作拆成清晰场景,把经验封装成可复用指令,把外部数据接入工作流,再用专用 Agent 执行具体任务。沿着这个方向,WorkBuddy 可以逐步发展成一套更适合中国法律实务的智能化工作平台。

Skills 是一套完整的 AI 使用指南,包含教学路径、示例代码、最佳实践。

跟 MCP 的区别:MCP 是协议,Skills 是实现;MCP 回答“怎么调用”,Skills 回答“怎么完成”。

演进路线:2024 年手工写 Prompt → 2025 年 MCP 协议标准化 → 2026 年 Skills 封装跨平台复用。

(2)agent-deep-research(深度研究智能体):自主搜索、多源整合、结构化报告生成,支持本地文件 RAG 锚定。适合投研分析、竞品调研、学术研究、架构评估。

(3)ecommerce-skills(电商技能库):覆盖 Amazon、Shopify、Etsy、TikTok Shop 全平台。适合产品研究、营销自动化、供应链优化、商业分析。

(4)微信读书 Skill:批量拉取书籍笔记和标注,作为知识库素材。

安装:cdn.weread.qq.com/skills/weread-skills.zip。

(2)腾讯云 Agent Memory:Token 省 61%。核心技术是上下文卸载 + Mermaid 任务画布,解决长任务中上下文窗口易满、Token 成本高的问题。

(3)Codex 钩子系统:在任务关键节点运行自定义脚本,可以做工作验证、扫描密钥、记录日志。实操场景:Agent 帮你查企查查后,自动触发法条校验和格式检查。

(4)Kimi 网页桥接浏览器扩展:Agent 可以像人一样搜索、滚动、点击、输入。做法律调研时,Agent 可自动遍历网页上的司法数据。

(5)Codex 手机端可用:ChatGPT 手机 App 里直接用,出差途中也能跟进 AI 工作流。

ChatGPT、Codex、API 三大产品线合并为统一组织。Greg Brockman 全面接管产品战略,成为实际掌权者。三大产品线合并,意味着更好的产品协同。

Mustafa Suleyman 预测 AI 将在 18 个月内实现人类水平的性能,自动化大多数专业任务,包括法律、会计、营销、项目管理——所有坐在电脑前的白领工作。

Anthropic 在 GitHub 开源了专为法律领域优化的 AI 模型,更准确处理法律文本、合同、案例摘要。开源可自部署。

研究 anthropics/claude-for-legal 这个 repo 的 prompt 设计思路,可以优化自己的法律相关 Skills。

Bloomberg 报道:美国 AI 相关岗位出现大规模裁员。AI 对劳动力市场的冲击从理论进入现实。

本周趋势总结

1. Skills 成为AI工作流新标准

Karpathy 和 Matt Pocock 两位顶级 KOL 同时押注。Skills 正在取代 MCP 成为新范式。从“模型能力”竞争转向“生态整合”竞争。

2. Claude Code 生态全面爆发

自我进化能力成熟(hermes-agent)。企业级多 Agent 编排(Ruflo/Claude Flow)。AI 编程从“帮我补”升级为“帮我做完”。

3. 推理成本革命性降低

NVIDIA Rubin 平台推理成本降至十分之一。OpenSquilla 智能路由再降十倍。算力从“扩张期”进入“精细化运营阶段”。

本节内容选自「法律智能体设计师(LAD)知识库」,它的核心是一套法律业务与 AI 融合的完整体系——从认知,到方法,到真正可以上手的落地路径。

知识库具体介绍详见:《法律智能体设计师(LAD)知识库》正式上线

知识库核心内容「法律智能体设计师(LAD)实训手册」为付费订阅内容,订阅费用99元/年。

订阅知识库请添加知识库负责人微信开通权限。

订阅后,以下内容同步可见,无需额外付费。