标签

AI元老杨立昆:LLM路径已误入歧途,行业因盲目跟风陷入竞赛陷阱,他为何离开Meta?

👇关注后设🌟星标,获取第一手AI新动态本文内容整理自Yann LeCun(杨立昆)在Unsupervised Learning: With Jacob Effron频道的专访,讨论了Yann LeCun对当前AI发展的看法。原始内容参考:https://www.youtube.com/watch?v=ngBraLDqzdIYann LeCun(杨立昆)是著名AI科学家,图灵奖得主,被誉为“卷积神经网络之父”。他长期担任Meta(Facebook AI Research, FAIR)的首席AI科学家,主导了

2026-05-19 23:42:28  |  6 阅读

AI 前沿:Grok 绘图上线,Mustafa 预言白领危机

Grok 绘图功能启用、Claude 五日突破 M5 内核、Mustafa 断言 18 个月白领岗位遭替代1. Grok Imagine 绘图正式亮相 X 平台全面开放 xAI 图像创作能力,全员可用。依托最新文生图模型,兼容多种画幅比例,画质细腻度与真实感双重升级。2. 移动端 ChatGPT 融合 Codex 编程 ChatGPT 应用现已内置 Codex 手机编码特性,手持设备构建项目不再困难。3. Zerostack:纯 Rust 编程代理问世 秉承 Unix 理念、完全由 Rust 打造的编程代

2026-05-19 05:36:01  |  7 阅读

AI Agent 核心架构解析与 Claude Code 上下文窗口设计

本文以简洁直观的方式剖析了 AI 智能体的解剖结构,将其描述为一个 while 循环:利用 LLM 选择行动、执行行动、评估结果,并重复此过程直至任务完成。文章详细阐述了五个关键组件:作为做出选择的“大脑”的 LLM;思维链和思维树等规划方法;通过 MCP 等标准访问的工具(如网络搜索、代码执行);短期和长期记忆;以及将这些组件串联起来的迭代循环。文章还提及了用于确保安全自主性的防护栏。随后,简报涵盖了另外三个主题:REST、GraphQL 和 gRPC API 的对比及其权衡;将 Claude Code

2026-05-18 02:08:16  |  7 阅读

AI前沿动态 05.17|Amazon基础设施布局引关注,开源项目登顶GitHub热榜

《华尔街日报》今日刊文,阐述Amazon如何从此前被视为AI赛道落后者的身份,逐步重新确立为重要竞争力量。文章核心聚焦AWS的基础设施优势,以及Amazon收购Annapurna Labs后逐步构建的自研芯片体系。Graviton与Trainium等芯片使Amazon在大型语言模型训练与推理成本上掌握更多主动权,也让OpenAI、Anthropic等模型厂商更倾向将部分工作负载部署于AWS。这一现象的实质在于:AI竞赛不仅取决于聊天机器人的表现,更取决于能否提供稳定、经济、规模可扩展的算力资源。Micro

2026-05-18 00:41:28  |  4 阅读

大模型落地的关键:LLM对齐技术详解

在日常工作和开发过程中,很多人都遇到过大模型表现差异明显的情况:同样是大型语言模型,有的能准确理解"帮我整理一份1页的Q3项目进度表,把超支项标出来"这样的具体需求,直接输出可用的结果;有的却给你返回一篇3万字的行业综述,完全答非所问。很多人认为这是参数规模导致的差异,但实际上真正的差距在于是否做好了LLM对齐——这正是ChatGPT能够爆发的核心原因,也是当前大模型商业化落地最关键的工程环节。💡 核心定义LLM对齐指的是将大模型从"机械地预测下一个文字的工具",训练成"能够理解人类意图、满足实际需求的智

2026-05-17 14:05:11  |  4 阅读

解析 Boxagnts 架构:分层设计与 Rust 实践

该系统构建了四层递进的层级架构:作为整个体系的根基,所有内部 Crate 均向其靠拢,而它自身保持零内部依赖。核心准则:极简依赖、极致复用。开发新模块时,首要任务是审视 core 中是否已存在可用类型。此处堪称项目设计的精妙之巅。通过分阶段抽象策略(Phase 1A 至 6),逐步搭建起独立于提供商的接口体系:这种阶段性设计的独到之处在于:各阶段均能独立演进与测试。若要接入新提供商,仅需在 Phase 1D 中增加适配器,上层逻辑无需任何变更。当前已兼容的提供商涵盖:此处充当 AI 代理的“中枢神经”,完

2026-05-17 12:47:47  |  5 阅读

AI赋能渗透测试CLI工具 — 自然语言操控,快速挖掘安全漏洞

⚠️请勿使用文章中的相关技术从事非法渗透测试,因传播、利用本文所提供信息而造成的任何直接或间接后果及损失,均由使用者自行承担,作者不承担任何责任。工具和内容均来自网络,仅供学习与记录使用,安全性请自行测试,如有侵权请联系删除。⚠️注意:目前仅对常读和星标的公众号展示大图推送,建议大家将"0x八月"设为星标⭐️,否则可能无法看到,点击下方卡片关注我吧!💡项目地址在文章末尾!VulnClaw 是一款基于 AI 的渗透测试 CLI 工具,支持自然语言输入,能够自动完成从信息收集到报告生成的全流程

2026-05-16 01:20:31  |  5 阅读

开源 AI 可观测平台发布!LLM 全链路追踪与成本分析一站搞定

完全免费开源!源代码:https://www.gitcc.com/GoogleChat/hindsight-cn还在为 AI 应用回答幻觉找不到根源、LLM 调用全程黑盒、智能体出错没法复盘头疼?大模型 Token 成本乱飙却不知道哪里浪费,传统监控工具完全适配不了 AI 场景?这款专为大模型与 AI 智能体打造的企业级可观测平台,一站式解决 AI 应用全链路黑盒化、故障难定位、成本不可控、行为无审计的行业痛点,让你的 AI 系统从 “不可见” 变为 “全透明”。● 全链路 AI 行为无死角追踪:不管是

2026-05-14 11:45:09  |  4 阅读

大语言模型推理机制全解析

虽然大语言模型(LLM)的推理(Inference)听起来很复杂,但其实原理很简单。它不是像人类那样“思考”,而是通过数学概率计算“猜”下一个词。我们可以把它拆解为几个关键步骤:当你向 AI 提问(比如“今天天气怎样?”),模型其实不懂汉字。它会先把输入拆分成最小单元,即 Token。 * 什么是 Token? 它可以是字、词甚至偏旁。在中文里,1个 Token 约等于 1.5 个汉字。 * 模型会将这些 Token 转换成数字向量,作为推理的起点。这是 LLM 推理的核心。其原理是自回归(Auto-re

2026-05-14 09:04:13  |  9 阅读
AMD发布vLLM-ATOM插件提升AI推理效率

AMD发布vLLM-ATOM插件提升AI推理效率

IT之家 5 月 12 日消息,科技媒体 Wccftech 昨日(5 月 11 日)发布博文,报道称 AMD 推出 vLLM-ATOM 插件,在不改动现有 vLLM 命令、API 和工作流的前提下,提升 DeepSeek-R1、Kimi-K2 和 gpt-oss-120B 等大语言模型推理性能。 IT之家注:vLLM 是面向大语言模型部署的开源推理框架,重点优化高并发服务场景下的吞吐和显存利用率。与一般“单次调用”推理工具不同,它更强调请求调度、KV 缓存和连续批处理,适合企业把模型做成长期在线服务。 A

2026-05-12 22:44:28  |  5 阅读

AI Agent项目如何做用户验收?真实项目经验总结

全文约 3600 字,预计阅读 7 分钟。AI Agent的产出是概率性的,传统UAT的"对/错"二元判断失效了。本文分享一个三层评估架构(自动完整性检查 → LLM-as-Judge → 业务抽样验收),以及工程与业务协作的三个认知陷阱。"AI项目还需要做UAT(User Acceptance Testing)吗?"这个问题是在我们的AI Agent系统即将交付业务用户时,工程团队内部提出的。表面上看这是一个简单的流程问题,但深入想下去,你会发现它触及了AI项目与传统软件项目之间的一个差异:传统软件的产

2026-05-12 20:05:19  |  5 阅读

告别人工编写,AI智能体自主进化复杂技能:CoEvoSkills框架详解

如今,LLM智能体虽能轻松调用几个API工具,但在处理那些包含多个步骤、需要调试和验证的开放性专业任务(例如复杂的软件修复、科学数据分析)时,往往会感到力不从心。为了解决这个问题,Anthropic提出了“技能(Skill)”的概念——这是一种包含指令、脚本和领域知识的复杂工具包。然而,目前这些技能包主要还是靠人类专家手写,这不仅费时费力,还存在严重的“人机认知错位”(Human–machine cognitive misalignment)——人类觉得好用的流程,AI并不一定觉得好用。本文介绍了一篇前沿

2026-05-11 02:21:03  |  4 阅读

AI催化未来:港科大(广州)联动MIT共探医疗与教育创新

人工智能正以前所未见的速度进入医疗、教育以及公共生活的关键环节。它不仅在改变知识获取与决策方式,也迫使我们认真思考:AI究竟该怎样被构建?我们又要如何去衡量它?它又应该朝向怎样的方向前进?2026年5月12日,主题为AI as Catalyst: Explore AI in Healthcare and Education的全日工作坊将在香港科技大学(广州)举办。本次活动由麻省理工学院与香港科技大学(广州)主办,MIT Critical Data、香港科技大学(广州)计算媒体与艺术学域(CMA)、以及香港

2026-05-09 19:48:37  |  7 阅读

程序员视角下的AI发展历程与未来展望

这篇文章的构思已久,内容十分丰富。我想随意分享一下我近几年在AI领域的探索、体验以及观察到的生态变化,并夹杂一些个人对未来的期许。这并非一份严谨的行业分析报告,更多的是我作为一个程序员,对这段时期技术发展和应用实践的阶段性总结。其中不少观点或许有待商榷,但均源自我真实的实践和感受。本篇内容,将首先从我个人的程序员视角切入。从技术角度讲,大型语言模型(LLM)并非2022年才横空出世。若要追溯其源头,2017年6月12日Google发布的《Attention Is All You Need》论文,提出了Tr

2026-05-08 12:04:15  |  5 阅读

AI大模型争夺战:产业链速览(上)

上周,《华尔街日报》一则题为「OpenAI Misses Key Revenue, User Targets in High-Stakes Sprint Toward IPO」的报导援引「知情人士」称,OpenAI 首席财务官 Sarah Friar 曾向公司高层表达担忧:若营收成长速度不够快,公司可能难以按期支付未来的运算合约款项。该消息很快就外溢到 OpenAI 相关供应链,相关股价随即受到波及。不过就在短短一日内,科技巨头中四大 CSP(云服务提供商)陆续公布 Q1 财报,并再次上调资本支出计划,把

2026-05-08 03:02:28  |  7 阅读