AI 编程实战:多模型协同与成本优化心得
测试了数款主流 AI 编程助手,深入对比了它们的优缺点、模型差异及 Token 消耗机制。重点使用了 Claude Code,其表现稳定,能满足基础开发需求,确属得力助手。然而当下 AI 编程工具种类繁多,亚马逊 Kiro cli、字节 TRAE 等各具特色,体验感不输 Claude Code,其实编程 Agent 的底层逻辑与交互体验已逐渐趋同。 其中,字节 TRAE 的表现最令人惊喜,此前在 Claude Code(基于 Minimax-2.7 模型)上耗费数小时仍未解决的 Bug,频繁试错令人沮丧,
企业AI支出失控!月费高达34亿只因忘记设置Claude限额
2026年5月28日,据Axios披露,一位AI咨询师表示,其服务的某企业客户因未对员工Claude使用权限进行限制,单月AI支出高达5亿美元(约合33.9亿元人民币)。Axios报道中未透露该企业名称及AI咨询师具体身份。企业AI费用超支问题并非孤例。The Verge报道指出,微软正计划裁撤大部分内部Claude Code授权,并引导众多开发者转向GitHub Copilot CLI;微软对内解释为统一使用Copilot CLI,但知情人士透露这同样是出于成本考量,终止Claude Code授权可有效
全球首款端侧视频AI助手:OttoBox重构内容创作流程
针对视频制作中素材难以查找、团队协同脱节以及云端数据泄露三大痛点,联汇科技Om AI于BEYOND Expo 2026正式推出了全球首款运行在终端的视频原生AI智能体——OttoBox视频创作助手。依托AI Drive、AI Finder和AI Agent三大核心模块,配合顶尖AI PC算力,在确保数据绝对隐私的基础上,大幅提升创作效率。目前,该产品已在六大行业客户中深度应用,让端侧AI真正融入日常创作。三位一体的AI能力架构,彻底革新视频创作流程作为全球首款运行在终端的视频原生AI智能体,OttoBox
ZTO Express-W 5月28日耗资499.33万美元购入22.39万股
中通快递-W(02057)发布公告,于2026年5月28日,该公司以499.33万美元的总额购回22.39万股股份,回购单价区间为22.18-22.57美元。 责任编辑:卢昱君 新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。 郑重声明:1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证
AI编程的巨额Token开销
在X上关注了龙虾的创始人彼得,有一篇推文很有意思,贴出了用codexbar的Token使用量。一个月发出760万个请求,消耗token量6030亿,价值130万美元。换句话说,他每天用AI编程,成本是4万多美元。当然,我不认为这是他真实支付的使用成本。因为他是奥特曼的员工,是openai高薪的工程师,所以自然可以无限量使用自家公司的token。但他的token使用量大概率是真的,这个结果也是很吓人。给大家看看我一个月使用codex的情况,也就是530多美元,使用了6.34亿token给大家看看我一个月使用
AI词元万亿商机:全球需求激增,东南亚成掘金热土
2026 年,AI 领域最热门的概念并非 “大模型”,而是 Token(词元)。英伟达 CEO 黄仁勋曾表示 “Token 是新货币”,相关数据显示,全球 AI Token 的使用量持续激增,中国在这一领域处于领先地位,供需之间的差距也在持续扩大。同时,东南亚地区数字经济的迅速发展和日益开放的监管政策,使其成为 Token 交易的理想市场。这门生意是否值得投入?中国 AI 大模型发展迅速,Token 消耗呈爆发式增长:从大型企业到初创公司,整个行业都在全力投入 Token 领域:主要问题:需求激增,供应不
刘淼:数据壁垒:AI时代材料科学的关键竞争力 | AI for Science沙龙
编者按当人工智能开始重塑材料科学领域,真正的竞争优势究竟在哪里?5月21日,未来光锥「AI for Science 创变者说」第二期沙龙“AI+材料的千亿级机会”,邀请了三位学界与产业界一线专家,共同探讨AI+材料科学的前沿发展与实践经验。中国科学院物理研究所/松山湖材料实验室刘淼老师,结合团队与国际领先企业同台竞技的亲身经历,从自主构建Atomly数据库、开源GPT-FF力场,到打造全固态机器人实验室,给出了一个理性而坚定的判断:数据,才是唯一的护城河。为何 AI 时代要强调数据?这是人工智能领域众人高
英伟达性能暴涨594%,大厂却喊亏钱:你的AI用对了吗?
5月28日,两条看似背道而驰的AI新闻同步刷屏:英伟达放出了Polar框架,致使AI编程工具Codex的跑分飙升594.74%——从3.8%跃升至26.4%。Claude Code、Qwen Code等主流编程助手均从中获益。就在同一天,Uber首席技术官坦承:公司短短数月便耗尽2026年全年的AI预算,却只换来「几乎没有对用户真正有价值的成果」。微软也开始限制Claude Code的订阅访问,统一切换至内部Copilot。一面是AI能力飞速跃升,另一面则是企业界的集体反思。这背后的真相究竟为何?并非AI
Token成本真相:企业AI真的省钱吗
AI 最大误区:Token比人工更划算 企业AI正从"是否采用"转向"如何分配预算"阶段。 过去订阅SaaS服务,使用量增长往往意味着系统获得用户认可。但AI不同,Token消耗增加只说明计费器在转动,不代表业务实质改善。关键问题在于:每投入一美元推理费用,究竟产生了什么价值? 许多人认为几美元一百万Token的价格很亲民。然而企业部署AI并非每日简单提问,而是处理客服、工单处理、合同审查、风险控制、代码审计、数据挖掘等高频率任务。一旦规模扩大,Token就不再是试验性支出,而是固定的运营负担。 更棘手的
黄仁勋谈 AI 成本:钱可省,时间不可费
近期,黄仁勋在英伟达内部会议中,针对企业普遍担忧的 AI 应用成本问题直言不讳:“金钱上的些许损耗无妨,但时间的浪费绝不可取”,此举引发了业界关于技术投入与效率平衡的深入探讨。当下 AI 领域的焦点已不再是谁家的模型更强大,而是许多公司在大规模落地后惊觉成本过高,甚至连微软、Uber 等美国科技巨头也在寻求降本之道。在 NVIDIA 的内部研讨中,亦有员工担忧目前只是在空耗 Token,仅做表面文章却未能实质性提升生产力。黄仁勋指出,在新技术应用的起步阶段,过分苛求“零损耗”反而会拖累整体效率。他号召员工
墨芯 AI 斩获近 10 亿 C 轮,引领国产稀疏计算新风向
今日,作为国内 AI 推理算力领域的领军者,墨芯人工智能正式宣告完成接近 10 亿元人民币的 C 轮融资,此举成为近期国产 AI 芯片行业中规模最为宏大的融资案例之一。本轮投资由深创投、岩山科技、大湾区共同家园、力鼎资本及蕴盛资本等产业资本与市场机构共同领投,凯旋创投、创享投资、盛景嘉成等既有股东继续追加投入。这种“国资 + 产业 + 财务”的多元化股东架构,为墨芯的技术迭代升级与商业化进程奠定了坚实基础。此次募集的资金将主要投入到新一代 SparsePrime®AI 通用推理计算卡的量产与市场推广中,同
AI算力金融化:上海欲建全球定价中心
近期有一个正在暗流涌动,可能重塑未来十年全球资本版图的事件:AI算力的金融化进程。具体而言,上海期货交易所(SHFE)正筹备推出AI Token期货。这听起来像是个加密货币故事,但并非如此。这更像是1974年美沙之间确立石油美元体系的翻版。中国此次意图,是为21世纪核心战略资源——算力——建立以人民币计价的全球定价中心。对于持有跨境资产、处理SPV和cap table的人来说,这不仅是多一个交易品种,更是一个全新资产类别的诞生、监管与税务纳入。这局棋,必须看透。 "Token"不再仅指加密货币:从27倍估
AI万亿泡沫会破裂吗?
346亿美元,这是软银已投入OpenAI的真金白银。为筹措资金,孙正义抛售了英伟达、德意志电信、阿里巴巴和T-Mobile的股权。但他仍感不足,计划今年再追加300亿美元,将持股比例从11%提升至13%,甚至不惜举债。驱动这位69岁投资家全力押注的力量很单纯——随着OpenAI估值在2月达到8520亿美元,软银的账面收益已超450亿美元。巨大、快速的账面财富效应,让资本不计代价地抢购AI资产。在OpenAI最新融资三个月后,据CNBC、彭博社等媒体报道,Anthropic正在与投资人洽谈新一轮融资,目标估
支付宝 AI 支付突破 3 亿:开启人机共付新纪元
支付宝近日宣布其 AI 智能体支付交易量突破 3 亿笔,这是继“支付笔数与用户规模双双过亿”之后的又一历史性跨越。这一成就彰显了支付宝在 AI 支付领域的深厚技术底蕴与广泛的生态布局:高达 95% 的通用智能体框架兼容性:支付宝 AI 支付已全面适配千问、JVS Claw、Claude code、Hermes Agent 等主流通用智能体,同时支持千问 AI 眼镜、Rokid、未来智能 AI 耳机等智能硬件,覆盖理想、奇瑞、吉利、东风等品牌的智能座舱,以及 TRAE SOLO、Qoder、扣子等顶尖 AI
AI 编程的虚假繁荣:八成代码成废料,谁在承担代价?
2026 年 5 月 14 日,微软做出了一项令硅谷震惊的举动——终止了内部对 Claude Code 的授权许可。这并非因为工具难用。也并非因为工具过于强大。根本原因在于 Token 消耗彻底失控——而这种失控并非源于业务需求,而是一场自上而下的恶性内卷。微软并非个例。Uber 首席技术官 Praveen Neppalli Naga 在四月透露,公司仅用四个月便耗尽了 2026 全年的 Claude Code 预算。Uber 运营负责人 Andrew Macdonald 随后在访谈中道出了更残酷的真相: