标签

AI突破长文本极限,多数人却未察觉其深意

我是楚哥,某软件上市企业副总,深耕软件行业近二十载,自2018年起便与国内顶尖AI专家联手推进相关项目。今年六月这波模型发布热潮,在朋友圈刷屏,众人只注意到“又出新模型了”。坦白讲,这波兴奋实属多余。真正值得关注的数据仅有一个:上下文窗口。GPT-5.6已突破150万Token,Kimi K2.6更是激进,直接达到200万Token。这意味着什么?能将《三体》三部曲全文一次性输入,AI可从头读到尾,人物关系、伏笔线索,全盘铭记。以往与AI对话至第三轮,它便遗忘首句内容;如今?它能一口气读完你全年的工作日志

2026-06-06 14:05:42  |  2 阅读

【AI 与智能体 · 入门周 第2天】

零基础也能立刻上手的AI工具合集(2026最新推荐) 大家好,我是「ai与智能体」 昨天我们已经弄清了AI的本质,今天进入实操阶段——将AI工具安装在你的手机和电脑中。本文不谈深奥理论,只推荐真正免费、易获取、对新手友好且日常实用的工具。跟随步骤操作,今天你就能开始使用AI。 一、AI工具分类概览(先构建框架) AI工具主要分为以下几类: 对话聊天类:回答疑问、写作、翻译、头脑风暴 图像生成类:文字生成图片、图片生成图片 办公效率类:文档总结、制作表格、撰写邮件 代码编程类:辅助编写代码、调试程序 搜索研

2026-05-18 14:16:53  |  11 阅读
科大讯飞星火X2-Flash重磅发布,长文本处理能力达256K

科大讯飞星火X2-Flash重磅发布,长文本处理能力达256K

IT之家 4 月 29 日消息,科大讯飞星火 X2-Flash 模型今日正式发布,同步开放 API。 星火 X2-Flash 采用 MoE 架构,总参数 30B,最大支持 256K 上下文,宣称在智能体、代码等能力上实现了大幅提升,基于华为昇腾 910B 集群训练完成。 目前,AstronClaw、Loomy 已率先接入星火 X2-Flash。 科大讯飞表示,经 AstronClaw 实测,星火 X2-Flash 在深度研究报告、Skill 管理与调用、系统控制与执行等多类“养龙虾”最常用的任务上效果接近

2026-04-29 19:14:55  |  6 阅读

人工智能:短期是生产力,长期或更具毁灭性

好久没在公众号里更新了,主要是懒惰占了上风,自己也没什么想法要倾诉。尽管市场一路把我按在地上摩擦,我也没有就此认输,依旧在AH两个市场继续拼。最近一家人吃饭,给我小学一年级的女儿问到一个问题,她一本正经地说:“爸爸,是不是没有豆包就更好?”我追问:“为什么这么说?”她回答:“我听你和妈妈聊天,你们说豆包可能会让你们失业。要是你们失业了,我们家不就没收入了吗?”聊到AI这件事,我尽量让自己保持乐观。但对女儿的疑问,我其实也说不出明确答案。并且我发现,随着AI能力快速升级,去年那些零星谨慎讨论的声音几乎消失了

2026-04-28 17:22:24  |  6 阅读
DeepSeek缓存输入费大跳水

DeepSeek缓存输入费大跳水

4月26日,快科技消息称,国产大模型DeepSeek官方公布,全系API输入缓存命中费用降至首发价格的1/10;叠加限时优惠后,V4-Pro缓存输入最低仅0.025元/百万Tokens,刷新全球大模型价格纪录。 本次调价覆盖DeepSeek-V4-Pro、V4-Flash全系列,重点下调的是输入缓存命中的使用成本。 DeepSeek-V4-Pro:由1元降到0.1元/百万Tokens,在5月5日前再享2.5折优惠,实际支付0.025元。 DeepSeek-V4-Flash:由0.2元降至0.02元/百万T

2026-04-27 12:53:08  |  6 阅读

AI Agent 上下文不是越长越好

上一讲:AI 看到回答前的内容|生成式AI|第五讲上一篇我们已经把上下文掰开讲过一遍。模型在输出答案之前,实际接触到的信息,往往远不止用户刚输入的那一句。它还可能读到系统规则、历史对话、长期记忆、外部资料、工具返回、示例,以及中间推导。到了 AI Agent 这里,事情就会再往前复杂一层。在单轮问答中,用户提一个问题,模型给出一个回答。Agent 不只是负责答复。它会围绕目标先做规划,接着调用工具,查看结果,再判断下一步怎么走。这让 Agent 更像一个可以持续运转的系统。但这也带来一个很现实的难题:它每

2026-04-27 12:10:27  |  5 阅读

AI重应用,不拼排名

2026年4月24日,DeepSeek V4 预览版正式发布。这是 DeepSeek(深度求索)推出的新一代开源 MoE 大模型,统一配置 1M 超长上下文,重点强化长文本效率与 Agent 能力,并提供 Pro/Flash 两个版本。它原生支持 1M 上下文,整本书或整个代码库都能直接塞进来,不再需要 RAG 切块处理。同时它全面兼容华为昇腾 950PR,训练框架也从 CUDA 转向 CANN;单卡推理性能达到英伟达 H20 的 2.87 倍,能耗降低 40%。这条消息在国内外都掀起了不小震动,我也因此

2026-04-27 09:10:21  |  3 阅读
DeepSeek V4低调发布:百万上下文与低价策略能否突围?

DeepSeek V4低调发布:百万上下文与低价策略能否突围?

实测V4长文本、代码及推理表现。 AIX财经(AIXcaijing)原创 作者| 李梦冉 编辑| 魏佳 没有发布会,没有倒计时,DeepSeek V4就这样悄无声息地上线了。 这已是DeepSeek的常规操作。但这次的不同之处在于,他们在技术报告中主动提及:V4的能力仍不及GPT-5.4和Gemini-3.1-Pro,发展进度大约落后顶尖闭源模型3至6个月。 这句话在国内AI圈显得有些另类。大多数模型发布时,标配的都是“全球领先”“行业第一”。而DeepSeek反其道而行之,主动承认差距。 但如果细看此次

2026-04-25 22:56:58  |  7 阅读

四月AI大动作:国产主流平台集中升级迭代

导读:四月伊始,国内各大AI平台迎来一波集中升级。从文心一言、通义千问等头部大模型,到Kimi、DeepSeek等新晋AI产品,再到WPS AI等办公实用工具,均完成了功能修补、性能增强及权限调整。本次升级紧扣中文场景适配、长文本处理、编程创作、多模态融合等核心诉求,同步下调接口费用、增强商业应用能力,全方位助力个人创作、办公效率及企业落地。下面为大家盘点一下四月份国产AI工具的重点更新情况:作为国产头部大模型的代表,百度文心一言率先于4月6日完成版本迭代。文心一言4.0重点增强了中文语义理解,优化后中文

2026-04-25 07:12:04  |  6 阅读
DeepSeek-V4预览版上线:百万上下文,性能全面领先

DeepSeek-V4预览版上线:百万上下文,性能全面领先

界面新闻记者 | 宋佳楠 4月24日,DeepSeek全新一代模型DeepSeek-V4预览版正式发布并同步开源。该模型具备百万字超长上下文,在Agent能力、世界知识及推理性能上均处于国内与开源领域的领先地位。昇腾超节点全系列产品均兼容支持DeepSeek V4系列模型。 此次推出的DeepSeek-V4预览版包含Pro和Flash两个版本,均配备百万字(1M)上下文能力,打破了长文本处理的场景限制。新版本同时支持思维模式切换、Json输出、工具调用、对话前缀续写等企业级特性,FIM补全功能在非思考模式

2026-04-24 15:26:06  |  5 阅读

AI早报·第6期|GPT-6发布48小时深度解析:实测表现、价格博弈与行业影响

每日清晨7:30,为您精选AI领域值得关注的3条资讯。本期为2026年4月15日,星期三。事件回顾:北京时间4月14日,OpenAI正式推出GPT-6(代号"Spud/土豆"),凭借200万Token上下文窗口、原生多模态统一架构以及约40%的性能提升引发业界震动。发布48小时后,开发者社区的实测数据陆续公布。实测核心发现:基于多位AI研究员和开发者的独立测试,GPT-6的实际表现呈现以下特征:编程能力显著提升:在SWE-bench(真实软件工程场景)测试中,GPT-6达到78.5%的得分,虽略低于Cla

2026-04-15 07:34:50  |  4 阅读
阿里推新AI绘图模型:精准控色+超长文本支持

阿里推新AI绘图模型:精准控色+超长文本支持

新浪科技讯 4月1日下午消息,阿里巴巴推出全新图像生成与编辑一体化模型Wan2.7-Image,直击当前AI绘图领域“模板化面孔”与“随机配色”等用户痛点,实现高度个性化人物塑造,并强化色彩精准调控能力。 据了解,该模型覆盖文生图、图扩图、指令式修图及交互式调整等完整功能链。在人类主观偏好盲测中,其“文生图”表现超越GPT-Image1.5及国内主流竞品,在文字嵌入、写实成像与常识理解维度,逼近Nano Banana Pro水平。 为打破“AI脸”同质化困局,Wan2.7-Image升级虚拟人像定制系统,

2026-04-01 16:42:26  |  5 阅读