上下文窗_标签-酷阅新闻

AI编程工具周动态：Codex上下文再缩水、Claude Code连出Bug、OpenCode界面改版遭吐槽

📖全文1609字·阅读约需5分钟本周（7月11日至7月18日）多款主流工具纷纷出现问题。Codex的GPT-5.6 Sol上下文窗口再次被悄然缩减至258K，Claude Code两周内连续发布三个存在回归问题的版本，OpenCode的新界面设计则引发了用户最大规模的抗议。· · ·GPT-5.6 Sol上下文窗口再度静默缩减：353K→258K距离上次从1.05M砍至353K还不到一个月，OpenAI又把Sol的有效上下文从353K削减到了258K。用户翻遍官方文档也找不到任何更新说明。GitHub ↗

2026-07-18 12:02:29 | 15 阅读

月之暗面发布Kimi K3：2.8万亿参数模型即将开源

新浪科技讯 7月17日晨间消息，月之暗面于今日凌晨正式发布Kimi K3，声称这是公司迄今为止性能最强大的模型。据介绍，Kimi K3拥有2.8万亿参数，采用KDA混合线性注意力机制（Kimi Delta Attention）与注意力残差（Attention Residuals）技术，原生具备视觉理解能力，并支持100万token的上下文窗口。 Kimi K3属于开源模型，专为长程编程、知识工作和推理等前沿智能场景打造。月之暗面表示，尽管Kimi K3的整体性能仍不及最强的闭源模型Claude Fable

2026-07-17 08:41:53 | 8 阅读

AI对话为何突然“失忆”？专家解析核心机制，三策略助您节省大量API开销！

您是否也曾面临这种情况：向AI提供数十页资料，交流半小时后，它骤然开始“语无伦次”，连初始指令都遗忘殆尽？——这并非AI智力下降，而是其“记忆容量”已超负荷。今日，我们深入剖析一份源自资深AI领域专家的内部培训素材。他坦率指出：“语言模型仅聚焦当前时刻，它只处理即时输入。”欲使AI持续保持聪慧，您必须学会扮演它的“记忆管家”。本文将为各位揭示前沿实验室常用的三项AI记忆精简技术，并阐释AI何以如同人类般“抵触被强制遗忘”。阅读完毕，您不仅能洞悉AI智能体的底层原理，还能即刻将这些方法应用于明日的提示词优化

2026-07-12 22:22:03 | 12 阅读

AI词典05|上下文窗口：AI能读多长文本的硬性天花板

在前几期内容里，我们理清了Prompt提示词、RAG检索增强、Fine-tune微调三类核心使用方式。不管是精准撰写提示词引导AI思考，接入私有文档做问答，还是改动模型参数固化能力，所有操作都绕不开一个硬性物理限制：上下文窗口（Context Window）。如果把大模型比作一间用来存放对话与文本的阅读书房，Prompt、资料、对话记录都是需要放进书房的文稿，上下文窗口，就是这间书房固定的最大容积。一旦文稿总容量超出容积上限，最早送入的内容就会被直接丢弃，AI也就彻底遗忘了前置信息。上下文窗口，指大模型单

2026-07-12 21:36:33 | 10 阅读

揭秘ChatGPT核心机制：Prompt、Token与上下文窗口详解

DD熊原创出品 · AI名词100 假如你在ChatGPT里输入“帮我写一首关于夏天的诗”，AI几乎瞬间就能吐出蝉鸣、西瓜、晚风、星空等意象。看似神奇，其实它接收到的并非中文，而是一串数字。为何有时回答精准，有时却驴唇不对马嘴？这背后的5个底层密码，正是答案所在。① Prompt 即你与AI沟通的每一句话，是连接双方意图的桥梁。优秀的Prompt能让AI从“似懂非懂”变为“心领神会”。关键在于三点：身份界定（“你是资深设计师”）、指令明确（“帮我设计logo”）、条件限制（“黑底金线，极简风”）① Pr

2026-07-12 14:50:42 | 18 阅读

Demis Hassabis警示：盲目堆砌数据是AGI的最大误区

近半年来，科技巨头们热衷展示的并非AI掌握了何种知识，而是它单次能“吞噬”多少信息。上下文窗口已从十几万token飙升至百万级，谷歌Gemini甚至宣称具备千万级别的吞吐能力。这一数字极具诱惑力，仿佛只要无限扩大脑容量，AGI便会自然诞生。然而，Google DeepMind负责人、2024年诺贝尔化学奖得主Demis Hassabis在一次深度访谈中，为这条路径泼了一盆冷水。他的观点直截了当：将海量信息塞入AI大脑，并不等同于提升其智能水平。业界正将“记忆更多”误读为“理解更深”，这或许是通往AGI途中

2026-07-09 07:46:18 | 14 阅读

硬啃 AI 底层原理一天，感觉大脑在扩容

今天刷微博看到 tombkeeper 说想要讲清 AI 的整体思考，得从经济学讲到物理生物，没几万字下不来。这时我也想到自己用了不少时间的 AI，也算是入门了，知道用它来写自动化脚本，可问我 AI 的底层逻辑是什么，却支支吾吾，前 seawater连 token 这个概念都回答不出来，看来我也只是满足于用罢了。先啃再说我相信 AI 是未来的趋势，那想要抓住它，应该懂点基本原理，不需要自己手搓大模型，只要比现在了解得更透彻就够了。所以说做就做，我这个纯文科生，决心今天啃一下 AI 材料。那么啃什么材料呢？我

2026-07-05 22:23:49 | 26 阅读

AI模型参数究竟是什么？

哦，这些都属于不同的 AI 工具。7B、14B、70B、671B、MoE、激活参数、上下文窗口、Token、显存、量化、4-bit、8-bit……那么参数数量越多，模型就越智能吗？训练数据质量、训练方式、中文水平、代码水平、推理水平、后期调优、能否调用工具、是否经过量化压缩，以及它是否真正契合你的使用场景。这家公司拥有 700 亿个"能力连接"——相当于700亿个能为你效力的个体。它在每次响应时，基本都由一个 70B 体量的模型在运行。这个模型文件大小为 4GB，因此只要我有 4GB 显存就肯定够用了。

2026-06-30 02:38:14 | 15 阅读

掌握15个关键AI术语，系统理解人工智能本质

如今AI已成为日常话题，但多数人对其了解仍停留在表面。面对Token、Agent、上下文等专业术语，虽然单字都认识，却难以理解其内在逻辑。其实无需深究复杂的技术文档，AI的底层逻辑并不复杂。本文将用通俗易懂的语言，解释15个最常用且易混淆的AI核心术语。读完后你将建立完整的AI认知体系，不再被行业术语困扰。1、大模型2、Token3、上下文窗口4、参数规模5、开源模型/闭源模型6、模型训练7、模型微调8、提示词9、AI幻觉10、多模态11、Agent12、Skill13、MCP14、模型API15、Ope

2026-06-08 09:24:14 | 23 阅读

对AI无需客气，直接指令更省电

近期，联合国大学发布报告强调，为降低AI能耗及碳足迹，用户在操作ChatGPT等智能工具时应精简指令，剔除“谢谢”等客套话及无效闲聊，此举预计可减少25%的能耗。初看“不道谢能节电两成五”，似显荒诞，甚至令人怀疑AI是否过于机械。然而，若深入底层逻辑剖析，这实则是一个严谨的科学命题。不妨从三个维度厘清其内在逻辑：1. AI非“人”，缺乏“情绪过滤机制”人类沟通时，大脑会自动忽略“你好、谢谢、请”等背景词汇，仅提取核心语义。但大语言模型（LLM）本质是概率数学模型。当你对AI说“请帮我写段代码，谢谢”时，它

2026-06-07 16:40:26 | 33 阅读

AI突破长文本极限，多数人却未察觉其深意

我是楚哥，某软件上市企业副总，深耕软件行业近二十载，自2018年起便与国内顶尖AI专家联手推进相关项目。今年六月这波模型发布热潮，在朋友圈刷屏，众人只注意到“又出新模型了”。坦白讲，这波兴奋实属多余。真正值得关注的数据仅有一个：上下文窗口。GPT-5.6已突破150万Token，Kimi K2.6更是激进，直接达到200万Token。这意味着什么？能将《三体》三部曲全文一次性输入，AI可从头读到尾，人物关系、伏笔线索，全盘铭记。以往与AI对话至第三轮，它便遗忘首句内容；如今？它能一口气读完你全年的工作日志

2026-06-06 14:05:42 | 19 阅读

AI对话为何“健忘”？一文读懂上下文窗口

"欢迎来到【AI小白从0到1】进阶篇·AI实操指南，本期是第7讲"这种崩溃感，你肯定体验过。跟AI聊了半小时，聊完背景、数据、逻辑，回头问个细节，它居然反问你："能不能再说说您的项目背景？"简直无语，全都忘了。又或者让AI写长文，写到后面风格突变、人物改名、逻辑打架——显然它已经“看不见”开头的内容了。再比如让AI分析几十页文档，分析到一半，结论却跟之前说的对不上。这些问题的核心症结在于：上下文窗口。搞懂这一点，你用AI时能少踩一半的坑。更重要的是，你还能掌握几个技巧，让A

2026-06-02 08:15:23 | 31 阅读

AI 为何突然失忆？揭秘上下文窗口机制

与 AI 交流半小时后，它竟突然遗忘了之前的对话内容。这并非系统故障，而是上下文空间已满。这并非传统意义上的「对话」。每当你发送一条消息，我的处理逻辑是：将从第一句至今的所有内容，包括你说的和我回的都重新阅读一遍，再给出回复。实际上并无记忆功能，只有一条不断延长的数据带，每次需从头遍历至末端，才能生成答案。请想象一张办公桌。你将聊天记录、上传文档及我过往的回答全部堆放在桌上。我能看到的桌上所有物品，即是我工作的全部依据。这张桌子有个专有名称：Context Window，即上下文窗口。然而桌子尺寸有限。一

2026-06-01 22:10:28 | 36 阅读

AI行业速递 | OpenAI GPT-5.6即将亮相：上下文处理能力突破150万tokens

AI HOT MORNING BRIEF告别信息焦虑！每日仅需3分钟，即可掌握AI领域最关键的行业走向、热门产品、技术突破与深度洞察9大要点速览 |5大主题板块今日热词今日精选1OpenAI GPT-5.6月内推出，上下文容量达150万tokens2苹果采用1.2T参数量级Google模型革新Siri体验3华为何庭波首提韬定律，逻辑折叠技术实现芯片能效41%跃升趋势洞察：AI模型参数规模持续攀升，端侧与云端模型同步向更强性能、更长上下文方向发展，全球范围内技术伦理与合规监管亦成为重要议题。IT之家（RSS

2026-05-26 07:46:15 | 18 阅读

深度解析AI上下文窗口算法机制-人工智能基础系列七

深度解析AI上下文窗口算法机制一切始于2017年谷歌发布的一篇开创性论文。那一年，《Attention Is All You Need》问世，正式提出了Transformer架构。Transformer的核心在于Self-Attention（自注意力）机制。然而，自注意力的计算复杂度会随着输入序列长度的增加而呈爆炸式增长。当你向AI输入一句话时，其内部究竟是如何运作的？第一步：将输入的每一个词转化为三个向量——Q（Query查询）、K（Key键）、V（Value值）。第二步：计算“谁关注谁”。具体而言，每

2026-05-24 09:27:44 | 15 阅读