标签

Momenta曹旭东:预训练模型存驾驶隐患,需后训练修正

新浪科技4月25日晚间报道,正值2026北京车展举办之际,Momenta举办了名为“Momenta R7,物理AI序章”的分享活动。活动结束后,Momenta董事长兼CEO曹旭东接受了新浪科技等媒体的联合采访。 在谈到“Momenta如何利用海量用户数据”时,曹旭东透露,流程主要分为预训练和后训练两个环节。预训练阶段主要依托于80万辆量产车提供的海量数据,这些数据包含大量长尾场景,通过World Model进行预训练。 他进一步解释说,经过预训练的模型虽然具备了物理常识,但这并不等同于能成为一名好司机。由

2026-04-25 22:51:36  |  3 阅读

AI训练数据即将见底

当前主流人工智能技术大多依托机器学习与深度学习架构,其本质在于从海量数据中提取隐藏的模式与规律。缺少训练数据,模型将无法完成学习,人工智能的智能属性也就无从谈起,正因如此,数据常被视为人工智能的“能量来源”。步入大模型时代,采用自监督学习的预训练策略显著降低了对人工标注数据的依赖,使模型能够以更低成本、更高效率处理大规模数据集,推动了数据、模型参数与计算资源三者的协同发展。基于此,业界归纳出著名的规模定律:大语言模型的能力与模型参数量、训练数据规模、计算资源之间呈现平滑的幂律关系,简言之,就是模型规模越大

2026-04-23 18:35:34  |  4 阅读

人工智能学习机制的演变

第三章:AI中的学习我们之前探讨过AI中的知识本质——简单来说就是人类语言的空间结构和规律特征。AI通过压缩与提炼过程,从互联网海量文本中捕捉到人类语言的空间结构与常见规律。我之前提到生成式AI的训练分为预训练和后训练两个阶段,真正决定AI能力上限的是预训练阶段。预训练看似复杂,其实质就是完形填空。通过对互联网数据进行大规模的完形填空训练,AI掌握了人类语言的空间结构和内在逻辑,这正是AI能够根据你的开头续写全文的原因。由于编程语言属于人类广义语言的子集,AI因此能够生成代码。只要你使用的术语和编码属于人

2026-04-20 21:26:47  |  5 阅读

AI关键技术快速参考指南

1️⃣预训练(Pre-training)🔵核心定位:AI的「通识能力奠基」 📝通俗解释:模型部署前,通过海量通用信息(文字、常识、逻辑规则)习得基本技能,类似儿童学习语数外等基础学科。 ✨关键特点:计算资源需求巨大、训练周期漫长、主要由科技巨头主导;奠定AI的基础认知与表达水平。 💡一句话记忆:预训练=夯基石,构建通用技能根基2️⃣微调(Fine-tuning)🟢核心定位:AI的「领域专精训练」 📝通俗解释:采用特定领域数据(如医疗、法务、客服等)对已具备通用能力的AI进行定向优化,使其从"多面手"转型为

2026-04-15 12:10:16  |  4 阅读

AI如何读懂你的话语:技术原理解析

先抛出一个问题。你是否想过,当对ChatGPT或Claude输入一句话并发送后,另一端究竟发生了什么?它如何"领会"你的意思?它是否真的"理解"你?亦或只是在进行一场我们无法察觉的、极其精密的——文字猜测游戏?本期内容,我不探讨AI的使用技巧,而是深入AI本身。将带你进入那个黑箱,探究"理解"在机器世界中究竟是怎样的形态。无需任何技术基础。听完本期,你将对AI产生截然不同的认知——而且我保证,这种认知将直接影响你今后与AI的交互方式。第一部分:先澄清一个误解让我们从一个根深蒂固的误解说起。许多人认为,AI

2026-04-14 16:08:05  |  4 阅读

人工智能核心概念指南

1. Token概念阐释Token是大语言模型处理文本时的最小计算单位,可以理解为AI系统中的"文字基本粒子"。模型按Token进行计数、计费、限制长度。典型案例大约会被拆成8~10个Token这是 AI 里的文字原子。为什么说"养龙虾"?因为 AI 动脑子是要烧钱的。喂它国产 Token 还是进口 Token,你喂给它的 Token 就是口粮,喂得越多,这只龙虾就越有劲儿!就像给员工发工资,算力成本全看它。2. API概念阐释API(Application Programming Interface),

2026-04-13 15:29:58  |  4 阅读

AI幻觉揭秘:智能助手的认知陷阱

当下,公众愈发依赖AI答疑解惑,人工智能总能提供表面合理的回应,然而其输出中常夹杂着看似可靠实则虚构的"AI幻觉"现象。OpenAI联合佐治亚理工的2025年研究指出,AI幻觉并非单纯源于数据瑕疵,而是根植于系统内部的固有缺陷。这种现象根植于预训练及后训练双重环节。某些数据模式过于复杂,难以通过基础模型精准判别,即使信息本身准确,AI仍可能产生误判;低频、冷门知识因学习样本匮乏,更易遭AI张冠李戴或凭空杜撰。同时,现行AI评分体系仅对正确回答给予激励,承认"不知道"和给出错误答案同样得分低迷,倒逼AI为获

2026-04-10 21:32:09  |  6 阅读

AI从何而来:一段技术演进史

如果要聊ai的发展历程,就得先看看它诞生前的技术环境。毕竟ai并不是凭空出现的,更不是一落地就能侃侃而谈、无所不能。在2017年之前,如果希望ai处理一段文本,例如翻译一句话,或者判断一句表达是否合理,几乎只有一种主流方案:循环神经网络(RNN)。那RNN是怎么工作的呢?它会按词逐个读取,每读入一个新词,就把前面词的信息压缩进一个固定大小的“记忆向量”里,然后继续向后处理。听上去似乎挺合理,但实际上问题非常多。第一,容易遗忘。让RNN读一篇文章,等它看到第50个词时,第一个词的信息往往早已模糊不清,记忆能

2026-04-08 22:12:05  |  6 阅读

大模型时代的心理计算:从预训练到交互式应用的综述

人工智能与心理学的融合领域正在快速扩张,年发文量已由2000年的859篇激增至2025年的29,979篇。不过,这种迅猛发展也导致了方法论上的“碎片化”,即类似的计算技术在不同心理学分支中孤立发展。本文提出了首个系统性的分类框架,依据计算处理方式而非应用领域重构AI驱动的心理学任务,将其划分为四大类:分类、回归、结构化关系及生成交互式任务。通过对跨越预训练模型与LLM时代的300多项代表性研究进行剖析,我们探讨了计算方法如何从特定任务的特征工程演进至迁移学习及少样本自适应。此外,本文梳理了相关数据集、评估

2026-04-08 11:10:03  |  5 阅读

清华五道口AI前沿动态 | 智能应用多领域渗透:从实体机器人到医疗检测

各位读者,早安!这里是清华五道口AI俱乐部,每日为你推送人工智能领域的最新资讯。OpenAI公开新型预训练模型“Spud”研发详情2026年4月5日,OpenAI联合创始人兼总裁Greg Brockman向外界透露,公司正在全力开发代号为“Spud”的新一代预训练模型。该模型汇集了过去两年间的核心研究成果,主要提升了处理复杂问题、深化语义理解以及掌控长文本上下文的能力,被视作OpenAI迈向通用人工智能的又一重要基石。同时,OpenAI的战略重点正快速转向超级应用的构建,拟将编程平台Codex、Atlas

2026-04-06 10:23:32  |  4 阅读

AI科普:BERT如何让机器理解人类语言

你有没有在深夜询问语音助手:“明天会下雨吗?”它不仅听懂了,还贴心地提醒你带伞;或者当你在搜索引擎输入模糊不清的问题,它却精准给出你想找的答案?这些看似“智能”的表现,背后有着革命性的技术——BERT。欢迎来到“AI基础科普”系列。在这个系列中,我们将从基本概念开始,用通俗易懂的语言和技术解读,帮助你逐步了解人工智能。无论你是零基础的新手、对AI感兴趣的职场人士,还是正在入门的学生,都能在这里找到适合自己的知识。每篇文章都将围绕一篇经典论文展开,深入浅出地讲解其思想、方法与影响。今天是第12期,我们要解读

2026-04-03 21:33:48  |  5 阅读

数据质量决定AI未来

人工智能的能力常常让人觉得如同魔法一般——输入一句指令,瞬间就能获得流畅文案、可用代码,甚至生成逼真图像,无需复杂配置与漫长等待,便捷到让人误以为AI可以一键解决所有问题。但这份“魔法感”,也让很多人对AI产生了不切实际的期待,忽略了其背后最核心的支撑:数据质量。AI从来不是万能魔法棒,它能优化流程、提升效率,却无法脱离基础条件凭空创造价值。AI的成功,始终离不开高质量数据、完善的基础设施,以及持续的迭代优化。当下,AI正快速渗透到营销、销售、产品研发等各个行业,落地速度不断加快。可越来越多企业发现,再智

2026-04-03 16:25:13  |  4 阅读