AI术语全解析:从Token到Agent,一文读懂AI核心概念
在和身边朋友交流时,我发现不少人对人工智能的理解比较零散,缺乏系统性。有人把AI捧上天,觉得它无所不能;也有人完全不看好,觉得AI没什么真本事。所以觉得有必要给大家做一个全面的梳理。Token、上下文、大模型、知识库、RAG、Prompt、Agent、工作流、微调……这些概念到底是什么意思,它们之间有什么联系,我会按照合理的层次结构来讲解。先看整体框架:这个学习路径很关键。因为人工智能本质上是一层层构建起来的:先掌握"文字单位" → 再理解"大脑" → 再学习"知识外挂" → 再掌握"能力工具" → 再运
官宣!火山引擎 AI 智享会登陆鼓楼,精彩抢先看
当 AI 重塑研发范式怎样助团队摆脱重复编码、达成效能飞跃?5 月 29 日火山引擎 AI 产业智享会将盛大开启!特以此函邀请各界企业高管、技术领袖共聚一堂共探 AI 技术落地之道报名并亲临现场的前 300 家企业,将获赠 TRAE_CN 企业版一月使用权,零距离感受 AI 赋能研发的高速体验,名额稀缺,先报先得。身为火山引擎鼎力打造的 AI 原生集成开发环境,TRAE_CN 化身企业智能研发伙伴,协助团队剔除机械劳动,专注创新突破。获字节内部超九成研发团队实测背书,整体研发效率跃升三成,需求交付周期显著
AI GPU 在华遇冷 黄仁勋剑指 CPU 新蓝海
快科技5月24日讯,尽管美方近期再度放行H200显卡对华出口,但国内采购意愿寥寥。NVIDIA首席执行官黄仁勋坦言,其AI GPU在中国市场几近停滞,份额已让渡给华为等本土企业。不过,NVIDIA并未就此止步,而是将目光转向CPU领域。过去一年,CPU被视为AI算力的关键一环,AMD与Intel均加大投入,认为CPU与GPU的配比将升至1:1,需求量激增。黄仁勋对CPU市场的展望比AMD和Intel更为积极,预估市场规模将达2000亿美元。相比之下,AMD此前预测2030年CPU市场为1200亿美元,AR
AI科普首讲:大模型真相揭秘
本期避开代码与参数,用最通俗的言辞,剖析大模型的底层逻辑。许多人误以为大模型是装满知识的超级数据库,问什么便直接提取答案。这是最常见的误区。大模型的根本属性,是基于海量文本训练而成的概率预测引擎。其核心任务唯有一个:依据前文,预测下一个出现概率最高的词汇。当你询问“天空是什么颜色”时,它并非查阅百科全书,而是基于学习的数万亿字语料,算出“蓝”字接在“天空是”之后的概率最高,从而输出“蓝色”。我们所见的流畅对话、逻辑推演、知识问答,皆是这种“文字接龙”能力在超大规模下涌现出的现象。“大模型”之“大”,绝非指
量子算力迎来“极速缓存”新突破
树状量子随机存储架构示意。受访者供图 传统计算以比特为信息单元,每个比特非0即1,宛如只能沿单一轨道前行的旅客;而量子计算依赖量子比特,凭借量子叠加特性,能同时处于0和1的概率叠加态,好似一位可分身万数、并行探索的超级行者。 不过,这位“超级行者”却遭遇了一个尴尬的瓶颈:它虽能极速奔驰,但在读取数据时却只能像常人一样逐页翻阅。若缺乏高效的数据接口,量子计算机便如同空怀强健体魄、却只能慢速查阅纸质地图的探险者,再快的运算速度也会因数据搬运迟缓而被拖累。 如何为量子计算机构建“高速缓存”是全球量子计算界的一块
AI 早报 0525:供应链遭 TrapDoor 突袭,微软谈 AI 成本,DeepSeek 大幅降价
📏 全文约 1750 字 | ⏱️ 阅读约 4 分钟 | 📅 统计截至 2026 年 5 月 25 日一场代号为「TrapDoor」的协同式供应链攻击,瞬间席卷了 npm、PyPI 及 Crates.io 这三大主流开源包仓库,共计波及 34 个恶意软件包。这并非寻常的代码注入事件——攻击者另辟蹊径,将矛头直指开发者日常依赖的 AI 编程助手。其攻击手段颇为老辣。黑客向热门开源项目提交 Pull Request,植入精心伪装的 CLAUDE.md 与.cursorrules 配置文件。这些文件虽非可执行程
英伟达 AI 显卡在华份额清零,黄仁勋转战 CPU 领域
5 月 24 日传出消息,NVIDIA 掌门人黄仁勋公开坦言,受限于美国出口禁令及本土采购方针,NVIDIA AI GPU 在中国市场的占有率已近乎为零,这部分份额正由华为等国内企业接手。即便 H200 显卡近期获得对华出口许可,国内方面也无实际采购意向。在 GPU 领域遭遇阻碍后,NVIDIA 正全力加速布局 CPU 市场。黄仁勋预判,涵盖中国在内的全球 CPU 市场总规模可达 2000 亿美元,这一数值约为 AMD(1200 亿美元)及 ARM(约 1000 亿美元)预估值的两倍。值得关注的是,该预测
50万人规模验证:医疗通识AI模型突破疾病预测与分型难题
《npj Digital Medicine》期刊发表的《A foundational model encodes deep phenotyping data and enables diverse downstream applications》研究中,针对深度表型数据具有数据量大、维度高、类型混杂(含连续型生化指标、单项/多项分类变量及生活方式问卷调查)等特点,导致传统统计模型与常规机器学习难以捕获高阶非线性关联的瓶颈问题,提出核心观点:借鉴自然语言处理中的基础模型架构,可将个体的全景表型特征转换为类似
伊朗未就核谈细节作承诺
据当地媒体5月24日报道,伊朗方面称,对于资产解冻与核材料转移之间关联的媒体报道存在异议,表示不会将解冻资产与核材料问题相挂钩,目前就核问题的具体承诺尚未明确。 伊方强调,一旦达成协议,应立即解冻部分被冻结资产,确保伊朗能使用这些资金。若不解冻资金将触及伊方底线,双方难以达成共识。 伊方还指出,由于包括美国阻挠解冻资产在内的多种原因,谅解备忘录内容尚未最终确定,因此存在无法达成共识的可能。(总台记者 李健南 王政) ©2026中央广播电视不采用
220TB+ 海量 ERA5 数据集:赋能低空气象与 AI 大模型训练
ERA5 全球常规变量再分析资料集(专为气象 AI 大模型训练及低空气象研究打造!)ERA5 全球常规变量核心参数:数据体量:超 220 TB文件格式:NetCDF (.nc)归档策略:每日单文件(含 24 个时次)时间跨度:1979 年 1 月 1 日至 2025 年 12 月 31 日覆盖范围:全球全域时间粒度:每小时空间粒度:0.25°×0.25°单层/地表层级:1 层多层垂直气压层(hPa,含 23 个标准层):'5' ,'10' , '50','100','150','200','250','3
Brandes增持中国民航信息76.8万股,每股9.45港元
香港联交所最新披露,5月19日,Brandes Investment Partners,L.P.增持中国民航信息网络(00696)76.8万股,每股价格为9.45港元,总计金额达725.76万港元。增持后,其最新持股数量约为5606.78万股,持股比例为6.01%。 责任编辑:卢昱君 新浪财经声明:本文系转载合作媒体内容,新浪财经发布此文仅为了传递信息,文章信息仅供参考,不构成任何投资建议。 郑重声明:1.根据《证券法》相关规定,禁止编造、传播虚假或误导性信息,扰乱证券市场;2.用户在本社区发布的所有资料
ICLR2026中国论文总量称冠,美国Oral仍占优
ICLR 2026 全球百大机构榜单中国大陆高校及研究机构投稿超 2300 篇,比例达 43.7%,美国投稿约 1700 篇,占比 31.9%。若将中国大陆与香港(7.7%)数据合并,本届 ICLR 逾半数论文均标注中国机构署名。就机构表现而言,清华大学以 6.2% 的占比、332 篇论文的数量,牢牢占据全球榜首,上海交通大学(240 篇)与浙江大学(232 篇)紧随其后。中国科技企业的参与热度同样显著,阿里巴巴集团贡献 135 篇,字节跳动产出 107 篇,此外,国际顶尖 AI 新型科研机构上海人工智能
深度解析AI上下文窗口算法机制-人工智能基础系列七
深度解析AI上下文窗口算法机制一切始于2017年谷歌发布的一篇开创性论文。那一年,《Attention Is All You Need》问世,正式提出了Transformer架构。Transformer的核心在于Self-Attention(自注意力)机制。然而,自注意力的计算复杂度会随着输入序列长度的增加而呈爆炸式增长。当你向AI输入一句话时,其内部究竟是如何运作的?第一步:将输入的每一个词转化为三个向量——Q(Query查询)、K(Key键)、V(Value值)。第二步:计算“谁关注谁”。具体而言,每
人工智能与智能体开发必备概念指南
一、机器学习基础 · 监督学习:利用已标注的数据集进行训练,建立输入到输出的对应关系。 · 无监督学习:基于未标记的数据,自动挖掘潜在的内部结构或规律。 · 强化学习:智能体通过与环境的交互试错,依据奖励和惩罚机制学习最优决策方案。 · 特征与标签:特征指输入的属性信息,标签则是需要预测的目标值。 二、核心算法与模型 · 神经网络:模仿人脑神经元结构的计算模型。 · 深度学习:运用多层神经网络结构的机器学习分支。 · Transformer:基于自注意力机制的模型架构,是现代大规模语言模型的基础。 · 大
AI核心概念通俗解读
点击蓝字 关注我们本文不旨在深度剖析所有术语,唯一目标是:助你建立对 AI 的基础认知。多数人眼中的 AI,是一个能聊天、写代码、绘图及总结的黑盒。但若稍作拆解,AI 通常包含以下要素:首先谈谈最核心的概念:模型。你常听到的 GPT、Claude、Gemini、Qwen、DeepSeek,指的都是模型或其家族。它能依据输入信息,产出对应内容。你提一个问题,它便给出解答。你给一段代码,它可补全代码。你给一张图片,它能描述画面。你可能常见到此类表述:这里的 B 通常代表 billion,即十亿。7B 大约指