标签

多模态AI的认知困境:为何能感知万物,却难以真正"理解"?

The AI Frontier | 前沿公开课多模态AI的认知困境:为何能感知万物,却难以真正"理解"?斯坦福CS25公开课:一位跨模态研究者,揭示了"原生多模态"最核心的矛盾原生多模态智能 · 斯坦福 CS25 Transformers United V6"我们几乎把语言模型的整套方法论,照搬到了多模态领域。但我想说——这只是起点,远非终点。"—— Victoria Lin|Thinking Machines Lab 技术成员,前 Meta AI / Salesforce AI 研究科学家你可能每天都在

2026-06-07 02:08:15  |  1 阅读

人工智能七十年:从图灵之问到ChatGPT时代

人们常常在短期内高估一项技术的影响力,却又在长期内低估其深远意义。如果你是近两年才因ChatGPT而真正关注人工智能,那么你所见的,不过是冰山浮出水面的那一角。水面之下,是七十载的跌宕起伏,以及无数天才、狂人与先知之间的恩怨交织。本文无意预测技术奇点,也不渲染末日恐慌。我只想尽量客观地梳理:AI是如何走到今天的,它当前真实的能力边界在哪里,未来数年最值得关注的几个变量——以及,为何那些最聪明的大脑会为此争论不休。故事要从被誉为"计算机科学之父"的英国数学家图灵说起。1950年,这位曾在二战中破译德军密码的

2026-06-05 02:06:39  |  5 阅读

人工智能的演变之路

人工智能(AI)的演进历程,是一部在“愿景”与“低谷”中跌宕前行的技术探索史。从六十多年前一个理论概念的萌芽,到如今深刻重塑人类社会的革命性技术,AI的“前世今生”大体可划为三个重要阶段: 🌱 初创与符号系统时代(1950年代 - 1980年代):梦想点燃,规则主导 这一时期是AI的“幼年阶段”,研究者们尝试通过预设精确的逻辑框架使机器具备人类般的推理能力(即符号主义方法)。 * 1950年:英国学者艾伦·图灵发表了开创性的论文《计算机械与智能》,首次提出了著名的“图灵测试”,为“机器是否能思考”奠定了哲

2026-06-03 19:15:29  |  4 阅读

AI三巨头九载博弈:OpenAI变革、Anthropic突围、Google反击

2026 年 6 月 2 日,Anthropic 向 SEC 秘密提交 IPO 申请,估值 9650 亿美元,首次超越 OpenAI 的 8520 亿美元。你可能觉得这只是又一条融资新闻——但这不是。这是一个长达 9 年的故事终于走到了分水岭。要理解今天发生了什么,你必须回到 2017 年,回到那篇改变了一切的论文。2017 年 6 月,Google 发表了《Attention Is All You Need》,提出了 Transformer 架构。这篇论文的作者名单里,有几个日后将改变世界的人名字。Tr

2026-06-02 22:46:58  |  4 阅读

物理AI新突破:英伟达发布开源模型宇宙3

近日,英伟达发布了名为宇宙3的开源计划,这标志着首个完全开源的全能级模型诞生,它集成了原生视觉推理、场景与动作生成的能力。该模型基于突破性的混合变压器架构构建,旨在通过推理、生成及行动,赋能机器人、自动驾驶等领域的视觉人工智能、合成数据制作、闭环模拟及世界动作模型。近日,英伟达发布了名为宇宙3的开源计划,这标志着首个完全开源的全能级模型诞生,它集成了原生视觉推理、场景与动作生成的能力。该模型基于突破性的混合变压器架构构建,旨在通过推理、生成及行动,赋能机器人、自动驾驶等领域的视觉人工智能、合成数据制作、闭

2026-06-01 23:18:40  |  6 阅读

掌握AI数学基础:矩阵运算与Transformer机制解析

恭喜你走到了这个系列的最后一篇。回顾一下我们的路径:今天,我们把所有零件组装在一起,看到 Transformer 的核心公式:Attention(Q, K, V) = softmax(QKᵀ / √dₖ) × V这个公式里的每一步,你都已经学过了。今天只是把它们串起来。系列导航▻ 第一篇:从数轴到高维空间▻ 第二篇:向量的加减法 — 点积与余弦相似度▻ 第三篇:矩阵——空间的变形术► 第四篇(本文):矩阵乘法与 AI— 理解 Transformer 的最后一块拼图▻ 第五篇:激活函数——神经网络的开关▻

2026-05-31 18:15:46  |  8 阅读

AI每日学堂:深度解析Q-Learning与DQN算法:它们如何与Transformer联手改变AI

今天,我们用最通俗易懂的方式,为大家彻底讲明白这两个经典算法的数学原理、典型应用,以及它们在当代大模型架构中究竟扮演怎样的关键角色。数学原理Q-Learning的核心在于函数Q(s, a),它代表在状态s下执行动作a后,未来能够获得的累积奖励期望值。它的迭代更新公式源自经典的贝尔曼方程:Q(s, a) ← Q(s, a) + α [r + γ × max Q(s', a') - Q(s, a)]让我们逐一拆解这个公式:s:当前所处状态a:当前执行的动作r:执行动作后立即获得的即时奖励s&#

2026-05-31 10:24:44  |  17 阅读

AI驱动的经管研究实践:本科AI开发环境简易搭建指南

面向大模型与 Agent 学习的入门准备当前主流的大模型与 Agent 开发资源,其代码仓库与软件包分发节点多部署于境外服务器。国内网络环境下,若直接使用默认配置,常会遇到下载中断、速度过慢或连接超时等问题。一套稳定的本地开发环境,是后续学习 LangChain、LlamaIndex、Oll111111111111a 等工具的前提。本文提供的路径均基于国内可正常访问的服务,无需借助任何非常规网络手段。大模型项目依赖复杂,不同项目对 PyTorch、CUDA、Transformers 等库的版本要求各异。A

2026-05-30 10:46:44  |  4 阅读

新央企展现责任担当,长安汽车'十五五'开局展现新气象

在'十五五'规划的开局之年,长安汽车作为新兴央企,积极履行国家使命,展现出全新的发展态势。公司以创新为驱动,充分发挥央企责任担当,为行业发展注入新动力,开启崭新篇章。长安汽车在新规划期的起步阶段,以全新的发展面貌迎接挑战,通过技术创新和产业升级,不断推动企业向高质量发展转型,彰显出新央企的责任与担当。

2026-05-29 17:32:00  |  6 阅读

TransCode宣布启动针对ctDNA阳性结直肠癌的TTX-MC138 2a期试验

临床阶段肿瘤公司TransCode Therapeutics, Inc.(纳斯达克代码:RNAZ)今日宣布,正式启动其首选候选药物TTX-MC138的2a期临床试验,旨在评估该药物在循环肿瘤DNA阳性的结直肠癌患者中的疗效。这些患者均已完成为治愈目的的标准治疗。 本次试验与量子飞跃医疗协作组织合作进行,在其PRE-I-SPY框架下开展。试验计划招募最多45名患者,这些患者须已完成标准治愈性治疗,影像学检查未发现疾病证据,但ctDNA检测持续或转为阳性,提示可能存在微小残留病灶,即癌症复发的早期信号。 TT

2026-05-28 04:49:52  |  4 阅读

Transformer面临颠覆危机,五位发明人同台对决决定AI未来

五位Transformer创造者狭路相逢,O(n²)复杂度被视为致命缺陷,ChatGPT底层架构正接受终极审视。一场足以撼动整个AI产业根基的“思想拳击赛”正在硅谷展开。对阵双方并非外人,正是Transformer架构的缔造者们自己。5月初,旧金山,AI基础设施公司Pathway组织了一场辩论。舞台中央是Łukasz Kaiser——Transformer联合发明人、ChatGPT和GPT系列核心工程参与者。对面站着三位挑战者:Llion Jones,另一位Transformer联合发明人、Sakana

2026-05-27 21:09:05  |  5 阅读

AI入门指南 · 第二课:理解AI的两种核心模式

AI入门指南 · 第二课从预判到创造:AI的双轨发展路径$407B 生成式AI市场规模 (2027年预测) 73% 企业采用 至少一项AI技术 4.6x AI投资回报率 平均倍数$407B 生成式AI市场规模 (2027年预测)$407B生成式AI市场规模 (2027年预测)73% 企业采用 至少一项AI技术73%企业采用 至少一项AI技术4.6x AI投资回报率 平均倍数4.6xAI投资回报率 平均倍数在上一课中,我们讨论了通用智能的概念以及强AI与弱AI的根本差异。现在,让我们把视线从理论转向实际应用

2026-05-27 09:58:45  |  8 阅读

AI入门必读:一文读懂人工智能核心概念

"人工智能是否会取代人类?""三亿人面临失业危机?AI浪潮席卷而来!""AI将取代人类工作?大学生就业前景堪忧?"......人工智能的火热浪潮中,这类信息你一定见过不少,也许因此心生焦虑。对于刚接触AI领域的新人而言,知识体系庞大复杂,专业术语繁多,常常让人一头雾水,无从下手。AI究竟是什么?AI大模型又是什么?算力又指什么?什么是AIGC?GPT代表什么含义?今天就带大家深入了解AI,即artificial intelligence的缩写。Artificial,不少人会望文生义,以为是艺术(art)相

2026-05-26 23:34:41  |  9 阅读

AI 进化史:从规则机器到全能大模型的跨越

导语:昨日我们探讨了一个核心议题:究竟何为大语言模型?在此快速复盘:大语言模型好比一位博览群书的“语言天才”,通过吞噬海量文本来精通语言逻辑,胜任写作、总结、翻译、编程及陪聊等任务。然而,许多人心中或许仍有疑问:其实早在上世纪 50 年代,科学界便已开启探索:1950 年,英国数学家艾伦·图灵提出了举世闻名的“图灵测试”。其核心逻辑是:让人类同时与机器和真人对话。若人类无法分辨孰真孰假,便可认定该机器具备某种智能。这是否让你联想到今日与 AI 助手的交互场景?只不过彼时的计算机体积庞大,算力也极为捉襟见肘

2026-05-26 15:01:59  |  5 阅读

AI科普首讲:大模型真相揭秘

本期避开代码与参数,用最通俗的言辞,剖析大模型的底层逻辑。许多人误以为大模型是装满知识的超级数据库,问什么便直接提取答案。这是最常见的误区。大模型的根本属性,是基于海量文本训练而成的概率预测引擎。其核心任务唯有一个:依据前文,预测下一个出现概率最高的词汇。当你询问“天空是什么颜色”时,它并非查阅百科全书,而是基于学习的数万亿字语料,算出“蓝”字接在“天空是”之后的概率最高,从而输出“蓝色”。我们所见的流畅对话、逻辑推演、知识问答,皆是这种“文字接龙”能力在超大规模下涌现出的现象。“大模型”之“大”,绝非指

2026-05-25 12:08:13  |  5 阅读