凯哥解读 AI:李飞飞致力打破语言对智能的束缚
欢迎诸位关注“凯哥讲故事系列”微信公众号本文附带完整 PPT 资料,如有需求请添加凯哥微信,将此文转发至朋友圈并截图发送给作者,即可获取 PPT 全本AI 人物志·No.04 李飞飞:誓将 AI 从语言的牢笼中解放她曾言,AI 虽在字句间阅尽万卷书,却未曾真正凝视过一眼真实的世界。2007 年,在斯坦福校园的一间斗室实验室内,一位名叫李飞飞的年轻华裔教授,着手让学生做件在外行看来颇为可笑之事——从互联网上一张张抓取图片,并雇人手工为其标注标签。这项工程最终历时两年半,汇聚了一千四百余万张图像,划分成两万多
人工智能的加速演变(下篇)
2026年5月,青岛一家仅有20名员工的微型制造企业,采用了一款名为"创销宝"的AI智能体,在两周内完成了2.8万次电话外呼,触达近3万家企业,成功开发出35个新客户。这家企业的经营者——一位仅有高中学历的山东汉子——说了一句让我至今难以忘怀的话:"我花了3万块买了一个AI员工,它完成的工作量超过招聘10个销售人员。"老张今年43岁,来自青岛即墨,经营着一家机械配件加工厂,拥有20名工人。过去十年间,他的商业模式非常简单:招聘5名销售人员,底薪4000元加提成,派他们去周边城市的工厂逐家拜访开拓市场。20
具身智能:AI走向现实世界的新纪元
2026年的CES上,英伟达创始人黄仁勋说了一句话,让整个科技圈为之一振:"AI真正价值将从虚拟内容生成,迈向在物理世界中自主完成复杂任务。"他将人工智能的发展划为三个阶段:深度学习、生成式AI、物理AI。前两个阶段我们都已经经历过了。深度学习让机器学会了识别图像和语音。生成式AI让机器能写文章、画图、写代码。但它们始终活在屏幕那头,活在比特的世界里。物理AI要做的是——让AI跨过屏幕,长出"身体",在真实世界里干活。如果要用一句话定义:物理AI是能自主感知、理解、推理物理
感知融合:AI迈向统一认知之路
朋友们好,我是万象大叔。深耕AI领域,解析技术脉络,洞察产业趋势,助力商业变现与财富增长。目前,AI在单一模态内(特别是语言理解方面)已逼近甚至超越人类平均水平。但真正的智能,无论是生物的还是人工的,其核心在于跨模态信息的有机整合、深度理解与逻辑推理。人类无需将视觉信号“翻译”为语言再进行思考;我们天然在同一认知框架内处理光、声、语义与抽象概念。多模态AI的终极追求,正是打造这种统一的、原发的、基于感知的认知架构。这绝非给模型简单装配“眼睛”和“耳朵”,而是一场旨在消除模态间语义壁垒、让AI建立对世界统一
感知AI:物理AI的“第一道关卡”,让AI从“数字盲”进化为“物理通”
1. 范式跃迁:AI从虚拟空间“跨界”,感知成物理AI战略入口(关键拐点)英伟达定义:黄仁勋5月表示,物理AI的ChatGPT时代已到来,感知是“物理Token化”的根基,使AI能够理解三维空间、把握因果物理规律。技术分水岭:传统AI(ChatGPT)→数字思维、屏幕呈现、不谙物理;感知AI→实体感知、物理交互、理解重力/摩擦力/碰撞。2. 技术飞跃:3D视觉/力控/世界模型/物理引擎四大瓶颈同步突破(核心逻辑)3D视觉:奥比中光3D结构光精度达0.01mm、适应光照/遮挡环境;英伟达Cosmos视觉编码
Momenta曹旭东解读:世界模型与强化学习如何成为物理AI的双引擎
4月25日,Momenta在北京国际车展期间举办了一场以"Momenta R7,物理AI序章"为主题的专题分享会。四位联合创始人共同登台,围绕公司的技术理念、产品实力以及全球化商业拓展等核心议题展开了深入探讨,正式宣布Momenta R7强化学习世界模型实现规模化量产,标志着自动驾驶从"观察世界"向"认知世界"的战略性升级,物理AI正式从理论概念迈向大规模商业落地。 Momenta披露的数据显示,公司已成功交付超过70款量产车型,获得定点的车型总数突破200款,量产项目遍布十余个国家和地区。装配Momen
AI 视频迈向构建完整世界
NVIDIA Research 推出的 SANA-WM 颇具看点。它并非寻常的短时长视频生成手段,而是聚焦世界模型领域:致力于 60 秒级视频、720p 画质、相机操控及长视频的空间连贯性。对于创作者而言,关键不在于即刻投入商用,而在于洞察 AI 视频的演进趋势:从单纯生成美观片段,升级为构建可连续运镜的完整场景。#AI视频 #世界模型 #NVIDIA #AI工具 #视频生成NVIDIA Research 推出的 SANA-WM 颇具看点。它并非寻常的短时长视频生成手段,而是聚焦世界模型领域:致力于 60
AI元老杨立昆:LLM路径已误入歧途,行业因盲目跟风陷入竞赛陷阱,他为何离开Meta?
👇关注后设🌟星标,获取第一手AI新动态本文内容整理自Yann LeCun(杨立昆)在Unsupervised Learning: With Jacob Effron频道的专访,讨论了Yann LeCun对当前AI发展的看法。原始内容参考:https://www.youtube.com/watch?v=ngBraLDqzdIYann LeCun(杨立昆)是著名AI科学家,图灵奖得主,被誉为“卷积神经网络之父”。他长期担任Meta(Facebook AI Research, FAIR)的首席AI科学家,主导了
如祺数据首度亮相AI数据版图,全面发力具身智能与世界模型
新浪科技讯 5月19日下午消息,如祺出行旗下数据业务板块"如祺数据"首次向外界完整披露其AI数据资产版图。官方信息显示,如祺数据资产已覆盖标注数据、行为数据、合成数据及多模态训练数据集四大类。 如祺出行的AI数据服务近年保持高速增长。2025年,以该业务为主要收入来源的技术服务板块该录得营收1.60亿元,同比增长487.4%。截至2026年5月,公司已在广州、上海、重庆、沈阳等城市部署超过300辆智能驾驶数据采集车,每日可产出1600小时、130TB合规数据。如祺出行表示,依托在真实出行场景的长期数据积累
物理AI:从历史脉络到未来图景
物理AI的浪潮正汹涌而至。笔者认为,物理AI才是人工智能探索的终极疆域,反观当下流行的元宝、豆包等大模型,充其量不过是入门的“前菜”。平日里谈AI,大家多关注其在数字领域的文字生成、图像创作或股市预测,但物理AI(Physical AI)彻底打破了虚拟与现实的壁垒。它不再局限于处理比特,而是致力于走进由原子构成的物理三维世界,去感知、推理并改造现实。简言之,物理AI赋予了AI躯体与物理直觉,它嵌入在机器人、自动驾驶车辆、机械臂等自主设备中。不仅读得懂数据,更理解重力、摩擦力、碰撞等物理法则,从而在真实环境
AI 前沿:Grok 绘图上线,Mustafa 预言白领危机
Grok 绘图功能启用、Claude 五日突破 M5 内核、Mustafa 断言 18 个月白领岗位遭替代1. Grok Imagine 绘图正式亮相 X 平台全面开放 xAI 图像创作能力,全员可用。依托最新文生图模型,兼容多种画幅比例,画质细腻度与真实感双重升级。2. 移动端 ChatGPT 融合 Codex 编程 ChatGPT 应用现已内置 Codex 手机编码特性,手持设备构建项目不再困难。3. Zerostack:纯 Rust 编程代理问世 秉承 Unix 理念、完全由 Rust 打造的编程代
深度解析Physical AI:新一代人工智能系统
Physical AI(物理人工智能)指的是具备感知、理解、推理能力,并能对真实物理环境产生作用的人工智能体系。区别于传统AI(主要处理数字信息),Physical AI的突出特点是实现AI与物理世界之间的实时闭环互动。英伟达CEO黄仁勋的阐述(2025-2026年)Physical AI(物理AI)将开启人工智能发展的新纪元。——这是一种能够运动、行动,并与真实物理环境互动的AI。正如语言模型掌握了数字世界的信息处理能力,Physical AI将掌握理解与操控现实世界中物理实体的能力。三者关系:Phys
物理 AI 崛起:智能时代的新疆域
2026年5月14日,美国Figure AI举办了一场全程无剪辑的直播活动——Figure 03人形机器人连续运转33小时,成功分拣逾4万件快递包裹。全程零人工介入,独立完成整个班次任务。其处理速度达到每秒0.37件,效率为人工的1.8倍,对不规则包裹的识别率高达99.7%。它不仅能自主更换电池,还能完成自我诊断,无需人工监视。这已不仅是机器替代人类的新闻。这标志着人工智能正式从“对话”迈向“操作”的关键转折——整个行业正经历一次根本性的范式转变:从语言智能迈向物理智能。这一新范式被称为:物理AI(Phy
孙宇晨看好物理AI 五一视界股价大涨近30%受市场追捧
立足香港,放眼全球。新浪财经全球资本峰会金曜奖投票开启!探寻最具潜力的资本力量,你的支持至关重要,快来投票吧。 五一视界(06651)早盘股价攀升29.90%,目前报64.95港元,成交额达到10.52亿港元。 近期,波场TRON创始人孙宇晨(Justin Sun)公开指出,通用AI发展已近饱和,下一个增长极并非虚拟场景,而是物理世界的实际应用——他预测“物理AI将是未来十年最具潜力的超级赛道”。孙宇晨认为,近年来备受追捧的大模型主要解决的是信息处理问题,商业落地空间有限。相比之下,物理AI的核心在于把A
打造AI原生产品团队:2026年第20周AI速报
导语:前阿里通义千问核心负责人林俊旸创立新实验室,寻求数亿美元融资,估值或达20亿美元(约136亿人民币)。高榕资本与红杉中国正在洽谈,但交易尚未最终敲定。这一动态引发了业界对大模型人才流动及新兴AI力量布局的密切关注。导语:Cursor CEO Michael Truell在最新演讲中指出AI编程已步入“agent时代”:企业中75%的代码由AI完全生成,30%的PR由AI端到端完成。他将软件开发划分为手工、Copilot和agent三个阶段,并通过浏览器自建实验等案例,展示了AI从辅助工具向自主协作者