强化学习_标签-酷阅新闻

AI为何能输出复杂推理过程？原理大揭秘

AI 原理系列当我们使用AI时，若开启深度思考模式，模型会展示一连串的思考轨迹涵盖拆解难题、逻辑推导，甚至自我纠错比如像 “等等，感觉不对，我重新思考一下”这些繁复的逻辑推导究竟是如何实现的？首先，AI大模型的训练主要分为三个阶段预训练阶段监督微调阶段强化学习阶段别担心，这三个概念听起来很深奥，但我会尽量通俗地解释，让你了解核心逻辑让我们开始正题首先，AI大模型在完成预训练后—— 就从初始模型升级为基座模型此时通过海量数据的洗礼，人类世界的常识与物理法则已被内化于模型内部具体是如何内化的？本质上就是

2026-07-21 02:46:04 | 7 阅读

AI核心支柱技术全景解析

AI核心支柱技术机器学习：涵盖监督学习、无监督学习、强化学习深度学习：基于神经网络的智能学习范式自然语言处理：涵盖机器翻译、语音识别、文本挖掘等计算机视觉：包括图像识别、目标定位等专家系统：模拟人类专家判断的逻辑系统从技术原理、核心方法、前沿进展与典型场景四个层面系统梳理，构建完整技术图谱：机器学习是让机器从数据中自动发现规律的学科，关键在于构建最优映射函数。监督学习（有标签训练）：核心任务：分类（离散结果）与回归（连续预测）。经典算法：线性/逻辑回归、支持向量机（SVM）、决策树与随机森林、XGBoos

2026-07-20 23:49:08 | 2 阅读

精选百份“AI+军事”智能防务报告合集

强力推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告《多智能体交互的深度强化学习》爱丁堡大学10余位作者2022最新论文《以无人机为核心的海军力量投射新纪元》最新报告欧洲、威慑与远程打击能力强力推荐！全面了解美陆军AI布局 |《人工智能的战场应用》130页报告人机协同：《基于强化学习的有人-无人飞机编队任务规划：敌方防空压制（SEAD）任务》最新论文《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持强力推荐！《人工智能

2026-07-16 12:39:37 | 12 阅读

新品发布|数字孪生一体机震撼登场，融合国产渲染引擎与本地大模型

点击蓝字关注我们7月17日，2026世界人工智能大会（WAIC）将在上海盛大启幕，作为全球人工智能产业风向标，本届大会聚焦具身智能、工业数字孪生、本地私有化大模型核心赛道。我司将携自研六耳猕猴数字孪生引擎一体化整机重磅登场，完成行业首次六耳猕猴引擎内核+ML-Agents强化学习框架+智谱GLM5.2本地大模型底层原生封装真机发布，以软硬一体化整机方案，解决制造、轨道交通、矿山、油气、医疗器械等行业仿真训练、离线AI推理、数字孪生可视化碎片化痛点，为国产物理世界AI底座提供全新落地路径。行业痛点传统方案四

2026-07-14 15:41:53 | 20 阅读

生成性认知视角下的人工智能探索

作者：Banafheh Rafiee, Richard S. Sutton本文倡导将生成性（enactive）方法应用于人工智能的感知与认知领域研究。生成性方法将感知理解为智能体与世界之间的主动、技能化互动过程——智能体通过行动来获取感知，通过领悟自身行动如何影响其体验来理解世界。这与传统的被动观点形成鲜明对照：传统观点将感知看作大脑接收感觉信号、处理信息、然后发出行动指令的内部过程。生成性观点则突出感知的动态性、身体性和交互性，其根基在于嵌入环境中的智能体的生活经验。我们识别并发展了四个与人工智能密切相

2026-07-13 21:11:12 | 19 阅读

AI开始“自主进化”了？科学家让机器摆脱数据依赖，像生命体一样自我成长

如今，研究人员正试图将这种能力赋予机器。一项最新研究提出了一项颇具开创性的构想：让AI像生命体一样，最终迈向自我进化的道路。论文给出了一套全新的AI架构：需求驱动自系统（Need-Driven Self-System）与智能体自进化模型（Self-evolution Model of Intelligent Agents）。其核心目标清晰明确：推动人工智能从“被训练”迈向“自主成长”。AI距离真正的智能，还差什么？如今的大模型已相当强大，ChatGPT能够撰写文章、分析问题；视觉模型能够识别复杂场景；机器

2026-07-13 12:59:56 | 32 阅读

仅凭本体感知即可应对复杂地形：上海 AI Lab 推出全新四足机器人控制框架 HIM

全称：混合内模：利用仿真机器人响应学习敏捷的足式运动作者：Junfeng Long1,∗Zirui Wang1,2∗, Quanyi Li1, Jiawei Gao1,3, Liu Cao1,3, Jiangmiao Pang1 1OpenRobotLab, Shanghai AI Laboratory, 2Zhejiang University, 3Tsinghua University链接：https://doi.org/10.48550/arXiv.2312.11460目前，基于深度强化学习的四足机

2026-07-13 06:42:00 | 20 阅读

AI Agent训练环境平台 Bespoke Labs 获4000万美元融资，加速企业级Agent规模化落地

AI智能体训练平台 Bespoke Labs 今日宣布完成总计4000万美元的融资，涵盖由 Wing VC 领投的 A 轮融资，以及此前由 8VC 领投的种子轮融资。A 轮融资的跟投方包括 Mayfield、The House Fund、dbt Labs CEO Tristan Handy，以及来自 Anthropic、OpenAI 和 Meta 的多位天使投资人；种子轮投资方则包括 Google DeepMind 元老 Jeff Dean、Resolve AI CEO Spiros Xanthos 和

2026-07-07 09:59:12 | 27 阅读

AI三大流派与七十年起伏史

1956 年，美国达特茅斯学院，一群科学家聚在一起开了一个会。这个会的名字叫"达特茅斯夏季研讨会"，去的都是当时最聪明的人。会上他们提出了一个概念——人工智能。能到什么程度呢？他们当时就敢预测：机器会在 20 年内代替人类做所有工作。70 年过去了，这个预言没实现。但这场会议确实成了 AI 的"出生证明"。有意思的是，从那天起，做 AI 的科学家们就分成了三个学派。直到今天，这三个学派还在互相影响。理解了他们，你就理解了 AI 的半部历史。学派一：符号主义 —— 让电脑"讲道理"符号主义的核心思想很简单：

2026-07-05 22:05:27 | 13 阅读

智能驾驶新纪元：物理AI引领行业变革

2024年，智能驾驶聚焦于“城市扩展”竞争；2025年转向“端到端”对决；而2026年的核心词汇则是“物理AI”。进入2026年中段，中国智能辅助驾驶领域涌现出新焦点：物理AI。多家领先企业相继推出基于世界模型、VLA、强化学习等关键技术的策略，行业由此从“端到端模式”升级至“物理AI模式”。这一转型的广度和步伐，均超越了先前设想。01 物理AI的内涵：使AI领悟物理法则物理AI的基本思想是：AI不仅要依靠数据训练，还需把握物理世界的运行规则。传统智能驾驶模型倚重大量数据学习，但面对训练数据之外的物理情境

2026-07-05 08:51:15 | 19 阅读

AI技术周报：世界模型自适应、超导体AI发现、仿真新范式

近期AI技术领域迎来多项重大进展：LeCun团队实现世界模型在部署中的持续学习，阿里达摩院AI智能体在28小时内发现6.8万种超导体，英伟达与李飞飞团队提出“Real2Sim”新范式——仅需一段真实视频即可自动生成机器人仿真环境。学术方面，人大高瓴提出强化学习微调新算法，上海交大实现VLA数据筛选加速313倍；产品方面，智谱ZCode编程工具正式上线，Google SynthID水印认证已覆盖超千亿图片。以下按类别进行梳理。机构：纽约大学/AMI研究所（杨立昆联合创办） | 标签：【具身智能】【世界模型】

2026-07-04 09:55:00 | 76 阅读

AI前沿精选：揭示模型偏见与推理新策略（7.3）

LG - 机器学习 CV - 计算机视觉 CL - 计算与语言1、[CL] Distill to Detect：通过插件蒸馏暴露大语言模型的隐秘偏见 2、[LG] QuasiMoTTo：拟蒙特卡洛推理时扩展方法 3、[CL] DiscoLoop：融合离散嵌入与连续隐状态的循环架构用于多跳推理 4、[CL] 图原生强化学习借助概念重组实现可追踪的科学假设构建 5、[LG] 正确且恰当：结合可验证奖励与人类示例的语言模型训练摘要：利用插件蒸馏技术揭示大语言模型的隐性偏见、基于拟蒙特卡洛的推理时计算扩展、面向多

2026-07-03 08:04:17 | 24 阅读

探秘AI核心：机器学习的发展与未来

机器学习：赋予计算机“触类旁通”的智能引言：当电脑开启“自我修炼”之路设想这样一个画面：你收到一封来信，系统自动将其丢进“垃圾箱”。你点开流媒体平台，首屏全是符合你口味的视频。你用手机按下快门，相册自动按人脸将照片归类。你对着设备询问“明日气候如何”，语音助手马上给出了回应。这些看似习以为常的体验，其背后都离不开一项共同的核心技术——机器学习。究竟什么是机器学习？通俗地讲，它就是让电脑自主在海量数据里挖掘模式，再依照这些模式对未知数据进行推断。以往的程序代码好比一份详尽的食谱——你向机器下达每步的指令，它

2026-07-02 02:37:10 | 12 阅读

人工智能发展史：解构智能起源的五大关键

人工智能发展史：解构智能起源的五大关键智能究竟源自何处？随着大模型能力的持续跃升，这个核心谜题反而愈发引人深思。回望人工智能八十余载的发展轨迹，其本质是一部人类不断解构、探寻智能本源的思想演进史，一代代研究者的认知升级，共同拼凑出了智能起源的完整脉络。人工智能的探索肇始于20世纪40年代，当时科学家首次利用数学公式模拟人脑神经元运作，为机器复刻智能奠定了理论基础。随后，图灵提出了“机器能思考吗”这一经典命题，正式拉开了人工智能研究的序幕。这场技术探索的核心，始终是人类对智能本质的深度哲学思辨。早期学界确立

2026-07-01 12:24:26 | 18 阅读

精选百份“AI+军事”智能防务报告资料汇编

强烈推荐！【DARPA终身学习机器（L2M）】《自主系统感知与行动中的终身学习》美空军与宾夕法尼亚大学2022年最新234页技术报告《深度强化学习下的多智能体交互》爱丁堡大学多位作者2022年最新论文《无人机引领海军力量投射新时代》最新报告欧洲、威慑力及远程打击能力强烈推荐！全方位掌握美陆军AI布局 |《人工智能在战场上的应用》130页报告人机协作：《基于强化学习的有人无人编队任务规划：敌方防空压制（SEAD）任务》最新论文《综述：多智能体系统（MAS）的任务分配技术》美国空军项目支持强烈推荐！《人工智

2026-07-01 11:30:11 | 28 阅读