AI应用狂潮再起:英伟达定义TOKEN模式引爆市场,大模型龙头MiniMax回归A股
6月1日,A股三大股指整体走弱,但个股表现却呈现活跃态势,市场呈现出“指数低迷、个股强势”的分化特征。收盘时,上证指数收于4057.74点,跌幅0.27%;深证成指为15340.36点,下跌1.51%;创业板指报4006.62点,下跌0.78%。整体来看,全市场超3900只个股上涨,涨停个股超过160家,下跌个股仅约1500只。沪深两市合计成交额约2.88万亿元(沪市1.32万亿,深市1.56万亿),成交量较前一交易日略有下降。科技板块中的科创50指数表现最弱,跌幅一度扩大,显示科技类权重股调整压力较大。
LLM智能客服架构重构与优化
一次从"让 LLM 自由发挥"到"用状态机精确控制"的架构重构实践最近我对自研的 AI 智能客服系统做了一次比较彻底的架构重构——V4 版本。这次重构的核心变化是:从向量记忆驱动转向了状态机驱动。V4架构图:简单说就是:以前每个环节都丢给 LLM 去"自由发挥",现在用结构化状态 + 显式规则来控制流程。效果很直接——Token 消耗大幅降低、流程完全可控、可观测性也好了很多。这篇文章分享一下这次重构的思路、做法和一些具体的代码实现。先快速回顾一下这个系统的
资金低位切换:聚焦AI终端与应用新机遇
今日市场延续弱势震荡格局,高位科创芯片及部分AI硬件方向明确进入调整期。此前反复强调,对于高位表现疲软、连续放量下跌的板块需保持谨慎,一旦确认调整应果断止盈或减仓,犹豫不决极易导致利润回吐,难以控制回撤幅度。市场瞬息万变,执行力至关重要。今日盘面再次印证了以下两点:(1)高位确认调整的AI硬件与科创芯片短期需保持谨慎,宜控仓观望,若确认调整则应果断兑现利润或降低仓位。(2)从高位流出的资金,部分已流向AI终端和AI应用方向,昨晚周策略已重点提示这两个板块,周末也进行了详细梳理与关注。(2)另一部分资金则回
MiniMax M3模型重磅发布:性能飞跃却遭涨价质疑
向Token计费模式转型是顺应市场竞争的合理举措。在冲刺A股上市的同时发布新模型,MiniMax正在技术和资本两个维度同步发力。6月1日,MiniMax官方宣布推出全新模型M3,重点强化了编程和智能体两大核心能力,并同步推出M3 API限时7天五折优惠活动。官方透露将在未来10天内陆续公布模型技术报告并开源模型权重。模型上线后市场反响呈现分化态势。部分用户反馈响应速度明显提升,上下文处理能力表现优异,但更多用户吐槽Token消耗量急剧上升,同时官方调整了Token Plan订阅方案,实质上相当于变相涨价。
AI的Token账单:每一分智能都有代价
当我们向AI发送一条指令时,它并非像人类那样直接理解完整语义,而是将文本“打散”。举例来说,一段文字在AI眼中会被分解为单个汉字、英文单词乃至词根等基本单元。这就如同搭建乐高玩具的基础组件,或者测量用电量的标准单位“度”。AI每研读一份财务报告、一篇行业分析材料(输入环节),都需要消耗海量Token;而每生成一份分析报告、一段程序代码(输出环节),则是在“创造”新的Token。由此可见,Token既是AI认知世界的“基本颗粒”,也是未来衡量脑力工作成果的核心计量单位。Token经济学给予我们最深刻的提醒是
2026英伟达AI战略深度解析:从芯片巨头到规则制定者
报告完整版下载方式见文末这份 2026 英伟达 AI 战略报告核心结论:英伟达正从芯片商升级为 AI 全产业链规则制定者,以 Token 经济为核心,构建 “硬件 + 生态 + 能源 + 应用” 闭环,主导全球算力与 AI 基础设施竞争。报告显示,2026 年英伟达市值突破 5.5 万亿美元,数据中心业务占比超 92%,战略重心从 “卖 GPU” 转向AI 工厂与 Token 生产。硬件端推行四芯协同:Vera CPU 主导调度、Rubin GPU 负责训练、BlueField DPU 做数据中枢、Gro
AI时代的新三件套
AI时代的新三件套 从传统工作的三大件,历经云时代,如今步入AI时代 人工智能时代正重新聚焦于纯文本形式 过去二十年软件演进路径为: 纯文 → 多媒体 → 图形界面 但大模型诞生后,顺序倒置: 图形界面 → 结构化数据 → 大模型 缘由在于模型最精通处理的是Token。 #HTML #JSON #Markdown 江苏 , 4小时前 ,回顾工作流程的演变,从旧模式的三大件,历经云时代,如今已是AI主导。人工智能时代正重新拥抱纯文本。过往二十年,软件演进轨迹是:文本 → 富媒体 → 图形界面。然而随着大语言
AI独角兽Fireworks融资估值达1000亿
AI推理平台Fireworks AI正在进行新一轮融资谈判,公司估值已攀升至150亿美元(约合1000亿人民币)。这意味着又一家千亿元级别的独角兽企业诞生。这个成就仅用了四年时间——2022年,Fireworks AI正式成立,专注于为企业提供开源AI模型运行服务,并采用Token计费模式。目前该平台日均处理Token量已达30万亿,通过Token销售实现快速发展。背后的领导者令人印象深刻——Lin Qiao(乔琳),本硕均毕业于复旦大学,正是在这里开启了她的AI职业生涯。借助AI行业的发展机遇,她带领团
支付宝AI支付新突破:智能钱包功能正式亮相
就在数日前,支付宝官方正式披露了其AI支付业务的最新进展。截至目前,该AI支付功能已累计处理超过3亿笔智能体交易,市面上95%的通用智能体框架均已实现接入。虽然对于广大用户而言,近年来与AI互动早已成为日常。但借助AI交互完成购物下单,仍然是一种相对新颖的体验。在支付宝的大力推广、以及各类优惠活动的推动下,相信不少用户已经体验过AI支付的便利。对于一些基础的网购、外卖等场景,AI确实能够发挥重要作用。根据官方测试数据,从发出指令到完成支付,平均耗时从传统模式的20秒以上大幅缩减至5-8秒。而目前来看,支付
AI Token账单揭秘:企业如何避免陷入隐形成本黑洞
当下科技新闻的焦点几乎全被人工智能占据:• 一家国际银行宣称利用AI重塑风控体系,每年节省人力开支1.2亿美元;• 某SaaS企业表示“全员启用Copilot后,代码交付效率提升47%”;• 某巨头公布裁员名单,同时HR发布《AI增效白皮书》,醒目标题写着:“技术迭代必然推动组织变革”。这些消息令人振奋。但鲜有人提及,那家SaaS企业的工程师正为同一份公关稿,在Cursor中调用GPT模型上千次,单日Token消耗高达数千美元;也鲜有人提醒那家银行的风控团队,其Anthropic API调用中73%的请求
通俗解读 AI 术语:大语言模型 (LLM) 揭秘
感谢关注,欢迎互动,助您轻松读懂 AI,用好 AI!有时,人类会猛然察觉:自己其实并不真正了解自己。比如语言。长久以来,人类一直认为:语言仅是思想的"外壳"。真正关键的是:语言只是将这些内容表达出来罢了。因此过去几十年,人工智能的发展方向也顺理成章:既然想让机器变聪明,那就应该教它:工程师们曾试图像制造钟表那样构建智能。他们教导机器:AI 曾像一本庞大的说明书。它能下棋、能计算、能搜索,但始终不像人类。因为在人类世界中,最复杂的从来不是规则,而是语言。仅仅一句:"我没事。"
AI原生研发:超越Token消耗的迷思
许多企业发现,推动工程团队拥抱 AI 的首要举措,是将使用量转化为考核指标——设立内部排名、设定 Token 预算、将 AI 使用纳入绩效评估。Meta、Amazon、Microsoft、OpenAI 均被曝出类似的内部追踪手段。这种策略有了新称呼:Tokenmaxxing,即将 Token 消耗量本身视作生产力的代理指标。2026 年,Amazon、Microsoft、Google、Meta 这四家公司的 Capex 总额预计在 6500 亿至 7000 亿美元之间,签署这笔巨额预算的高管必须向投资者展
AI 编程实战:多模型协同与成本优化心得
测试了数款主流 AI 编程助手,深入对比了它们的优缺点、模型差异及 Token 消耗机制。重点使用了 Claude Code,其表现稳定,能满足基础开发需求,确属得力助手。然而当下 AI 编程工具种类繁多,亚马逊 Kiro cli、字节 TRAE 等各具特色,体验感不输 Claude Code,其实编程 Agent 的底层逻辑与交互体验已逐渐趋同。 其中,字节 TRAE 的表现最令人惊喜,此前在 Claude Code(基于 Minimax-2.7 模型)上耗费数小时仍未解决的 Bug,频繁试错令人沮丧,
企业AI支出失控!月费高达34亿只因忘记设置Claude限额
2026年5月28日,据Axios披露,一位AI咨询师表示,其服务的某企业客户因未对员工Claude使用权限进行限制,单月AI支出高达5亿美元(约合33.9亿元人民币)。Axios报道中未透露该企业名称及AI咨询师具体身份。企业AI费用超支问题并非孤例。The Verge报道指出,微软正计划裁撤大部分内部Claude Code授权,并引导众多开发者转向GitHub Copilot CLI;微软对内解释为统一使用Copilot CLI,但知情人士透露这同样是出于成本考量,终止Claude Code授权可有效
AI编程的巨额Token开销
在X上关注了龙虾的创始人彼得,有一篇推文很有意思,贴出了用codexbar的Token使用量。一个月发出760万个请求,消耗token量6030亿,价值130万美元。换句话说,他每天用AI编程,成本是4万多美元。当然,我不认为这是他真实支付的使用成本。因为他是奥特曼的员工,是openai高薪的工程师,所以自然可以无限量使用自家公司的token。但他的token使用量大概率是真的,这个结果也是很吓人。给大家看看我一个月使用codex的情况,也就是530多美元,使用了6.34亿token给大家看看我一个月使用