tran_标签-酷阅新闻

从算力到记忆：Kimi K3如何重新定义大模型的未来

在很多人看来，大模型能力的提升主要得益于硬件性能的增强。但实际上，当前制约AI发展的核心因素，已经从计算能力转移到了存储机制。如果说过去几年AI竞争的重心是"算力"，那么从2026年起，行业正在迈入一个全新的阶段：Memory First（记忆优先）时代。而Kimi K3的架构突破，正是这一趋势最具代表性的案例。让我们先看一个思想实验。老师给每位学生一本包含100万页的教材。每当被问到问题时，学生都必须从头到尾翻阅整本书来寻找答案。效率如何？答案显而易见。传统Transformer的工作方式正是如此。每当

2026-07-21 02:28:14 | 7 阅读

AI二十年：从沉默到会说会看会想

系列 · 终结篇第一期我们讲到2016年，AlphaGo击败李世石，全世界第一次亲眼看见AI的"可怕"。但如果把AlphaGo比作一个围棋天才，它的才华是"封闭"的——只会下棋，不会聊天，不会画画，不会写文章。就像一个智商爆表但从不开口的学霸，你知道他准厉害，但说不上来他厉害在哪。2016年之后发生的事情，才是真正让AI走进你手机、你办公室、你生活的那部分。机器不仅学会了说话，还学会了看、听、画，甚至学会了"推理"。这篇文章，就是这后十年的故事。如果你让我选一个字来形容AlphaGo之后这几年AI的发展速

2026-07-20 16:07:06 | 6 阅读

AI 工程从零起步：先打通底层全链路，再谈 Agent 构建

最近在学 AI 的朋友，常常会陷入一种尴尬处境。你能调用模型、能搭建 RAG、也能把工具接入 Agent，可一旦输出走样、检索失灵、成本爆掉，排查就像在黑箱外面敲墙。这套开源教程 ai-engineering-from-scratch，正是为了补上这一短板。它不从“搭一个聊天机器人”切入，而是把学习路径拉回底层：数学、机器学习、神经网络、Transformer、LLM 工程、工具协议、Agent、生产环境。每一阶段都要求你亲手写出可运行的小实现，再去调用成熟框架。听上去很硬核，可它的意义并非让每个人都去训

2026-07-19 15:53:56 | 10 阅读

AI创新密码：从0到1的范式革命

AI的来龙去脉：从0到1的原创创新密码人工智能的百年发展，从来不是简单的技术叠加与功能升级，而是一场从哲学猜想、理论突破、技术迭代到产业生态重构的史诗级创新运动。大众常常把“功能优化、产品微调、方案整合”当成创新，但真正推动AI时代更迭、重塑人类生产生活方式的，永远是从零到一的原创性范式突破。 AI百年发展史清晰证明：顶级原创创新不靠天赋灵感，也不靠偶然运气，它有固定的底层逻辑、可复刻的诞生路径、可规避的创新陷阱、可落地的实操体系。读懂AI的来龙去脉，就是读懂所有颠覆性创新的通用密码。一、AI的源头

2026-07-19 06:21:32 | 9 阅读

人工智能演进之路：从理论萌芽到全面赋能社会

人工智能演进历经思想萌芽、学科诞生、两次寒冬、深度学习崛起、大模型爆发以及治理规范六个关键阶段，核心驱动力来自算法、算力和数据三者的协同推进，已从早期理论探索迈向全面赋能社会的全新阶段。以下按时间顺序进行清晰梳理：一、思想萌芽阶段（1940s–1956）：理论奠基 1、1943年：麦卡洛克与皮茨构建神经元数学模型，模拟人脑神经元运作机制。 2、1950年：艾伦·图灵发表《计算机器与智能》一文，提出图灵测试，为机器智能判定确立标准。 3、1956年：达特茅斯会议顺利召开，麦卡锡、明斯基等科学家首次正式提出

2026-07-17 02:00:12 | 11 阅读

AI成长足迹(六)为何AI突然掌握对话能力？Transformer：AI理解能力的开端

前文我们探讨了互联网，它首次将人类文明整体转化为AI可汲取的知识资源。昨日有个议题未深入展开，即为何当前互联网数据已不再是优质的AI训练材料？原因在于，如今的网络空间已遍布大量AI自动生成的内容，且这类内容正持续增长。若继续用此类数据训练新的大模型，近亲繁殖般的后果将导致模型性能持续下滑。如何获取最新、最真实的数据，已成为亟待攻克的新挑战。我猜想，未来人类的价值或许就在于为AI供应数据

2026-07-16 07:50:23 | 17 阅读

Transformer高效改进方案：X-Formers技术全景解析

高效Transformer变体（X-Formers）技术分类与深度解析原始Transformer面临的核心挑战在于自注意力机制带来的二次方计算复杂度，这直接导致了算力资源与显存容量的双重限制，难以应对超长文本、超高分辨率图像、大规模批量训练等实际需求。自2019年起，学术界与产业界为实现降低注意力计算开销、优化注意力建模机制、增强长序列处理能力、减少计算资源浪费等目标，陆续提出了数百种Transformer改进方案，统称为X-Formers。本章节依据技术优化机制，将X-Formers划分为稀疏注意力、局

2026-07-14 07:17:48 | 11 阅读

AI演进之路：从卷积网络到注意力机制的技术变革

本文换一个视角，向下深入一层——探究支撑这些技术应用的模型，究竟是如何迭代演进的。01.你是否曾思考过：当我们观察一张老虎的照片时，无论它摆出什么姿态，我们都能认出这是一只老虎？但对于一段文字，哪怕只是调换词语的顺序，含义可能就完全改变了？这源于图像与文本在底层逻辑上遵循着截然不同的规律。图像信息依赖特征识别。无论老虎是趴着还是站着，只要有尖耳朵、圆眼睛、胡须等特征，就能准确辨认。姿态、背景、光线如何变化，都不会影响核心特征的提取。文本信息则依赖顺序关系。"我吃香蕉"和"香蕉吃我"——词语完全相同，仅顺序

2026-07-13 12:14:56 | 18 阅读

AI八十年：从梦想到日常工具

1956年，几位年轻学者在达特茅斯举办暑期研讨会，提出‘智能的每一层面都可被精确描述，进而由机器模拟’。会议虽无实质成果，却为之后七十年的人类技术理想定下基调。1943年，神经生理学家沃伦·麦卡洛克与数学家沃尔特·皮茨发表论文，用数学证明：由简单神经元组成的网络，理论上能计算任何可计算函数。这成为人工神经网络的理论起点。1950年，艾伦·图灵发表《计算机与智能》，未直接回答‘机器能否思考’，而是提出操作性标准：若机器在对话中令人类无法区分其为机器或人，则视为智能。这就是著名的图灵测试。1956年夏，约翰·

2026-07-07 07:32:38 | 13 阅读

硬啃 AI 底层原理一天，感觉大脑在扩容

今天刷微博看到 tombkeeper 说想要讲清 AI 的整体思考，得从经济学讲到物理生物，没几万字下不来。这时我也想到自己用了不少时间的 AI，也算是入门了，知道用它来写自动化脚本，可问我 AI 的底层逻辑是什么，却支支吾吾，前 seawater连 token 这个概念都回答不出来，看来我也只是满足于用罢了。先啃再说我相信 AI 是未来的趋势，那想要抓住它，应该懂点基本原理，不需要自己手搓大模型，只要比现在了解得更透彻就够了。所以说做就做，我这个纯文科生，决心今天啃一下 AI 材料。那么啃什么材料呢？我

2026-07-05 22:23:49 | 27 阅读

AI驱动科研全链路实战训练营

线上直播直播时间：7月18日-19日、25日-26日【提供全部资料、代码及长期回放】前言课程大纲证书及学时报名方式面向真实科研场景，构建由Codex、Claude Code、OpenClaw、Hermes四位"AI研究员"组成的可迭代、可迁移的科研协作团队实战培训班直播时间：7月17日-18日基于claude code、codex双AI协同论文写作撰写与质量校准：从"数据分析→论文初稿→交叉审稿"全流程直播时间：7月25日-26日2026基于前沿AI-Agent2.0驱动的科研全链路实战营：一站式掌握LL

2026-07-04 18:10:52 | 23 阅读

人类智能与AI的本质差异

所谓人工智能，简而言之，就是针对特定任务，将多种精妙的数学手段进行线性与非线性的整合，构建出一个小型系统。其目标是让输入与现实一致的参数时，能够输出尽可能吻合的结果。这在历史上被称为“深度学习模式下的神经网络”。神经网络的基本原理究竟为何？我们用通俗的语言来解释。这个小型系统被称为“模型”，规模较大的模型通常拥有数量庞大的参数。为了让模型输出尽可能接近现实，必须进行高质量的训练。在训练过程中，输入数据即可产生模型输出，将其与理想输出进行对比并计算误差，再利用该误差对模型进行调整（即调整模型参数的数值，最常

2026-07-02 22:39:49 | 14 阅读

人工智能核心知识 - 从基础原理到发展历程

一、课程整体概述1.1 课程架构必修基础模块•机器学习与人工智能入门•深度学习核心：卷积神经网络（CNN）•深度学习进阶：Transformer 与自然语言处理1.2 教学目的与展望以就业为导向的综合训练◆理论素养（Knowledge）：系统化讲解理论框架◆编码技能（Coding Test）：结合行业场景的代码实践◆求职准备：覆盖所有面试可能涉及的知识点核心能力强化◆手写算法：梯度下降、CNN 架构、Transformer 结构◆理论掌握：能够口头阐述算法原理及实现方法◆实践能力：完成课后任务与代码练习二

2026-07-02 19:01:27 | 15 阅读

Etched斩获8亿美金投资，AI推理芯片竞争加剧

人工智能芯片初创企业Etched于本周二宣告脱离隐匿状态，公布已筹措总额达8亿美元的资金，同时斩获逾10亿美元的客户订单。该企业预计在今年夏天向客户交付其机架级别的推理系统。在上述融资中，最近一轮发生于去年12月的5亿美元募资，使其投后估值攀升至50亿美元。此轮融资由Stripes领投，彼得·蒂尔、Positive Sum及Ribbit Capital等机构与个人跟投。此外，量化交易巨头Jane Street主导了一轮先前未曾披露的融资，对Etched的累计注资额已突破1亿美元大关。 Etched由哈佛

2026-07-01 08:17:38 | 14 阅读

揭秘AI瞬间把握核心的奥秘

揭秘AI瞬间把握核心的奥秘「猫没追上那只老鼠，因为它太慢了。」这里的「它」指的是猫还是老鼠？人类瞬间就能明白，AI凭什么也能理解？这靠的就是大名鼎鼎的「注意力机制」。AI 每处理一个词，都会回头审视整个句子，给其他词打分：跟我有多相关？越相关，就越「关注」它。打个比方：就像你带着问题在一堆资料中搜索。你的问题是Query，资料的标签是Key，匹配上了就把对应的Value提取出来。那「相不相关」怎么判断？把两个词的数字向量对应位相乘再相加（这步叫点积），得数越大，两个词就越匹配，注意力分配得越多。这个

2026-06-30 14:16:00 | 28 阅读