标签

AI进入合规算力重构期

导语:本周,AI行业同时迎来“规则收紧”与“成本抬升”的双重转折。一边是监管体系密集落地,企业AI应用的合规边界被正式确定;一边是算力价格普遍上调,Token消耗进入指数级扩张阶段。对于正筹划数字化转型的企业来说,看懂这三条主线——合规支出、算力支出、政策机会——比紧盯单一技术指标更关键。以下是本周最值得留意的4条行业进展。1.全球首个AI拟人化互动监管办法发布,7月15日落地执行2026年4月10日,国家网信办、国家发改委、工信部、公安部、市场监管总局五部门联合发布《人工智能拟人化互动服务管理暂行办法》

2026-04-27 11:20:52  |  6 阅读
深圳千亿市值新锐崛起:投资回报高达500倍,腾讯成最大获益者

深圳千亿市值新锐崛起:投资回报高达500倍,腾讯成最大获益者

创投领域再现惊人回报。 故事要从四个月前说起——被誉为“Token第一股”的迅策科技在港交所挂牌,初期股价表现平平。然而,短短百余天后,公司市值竟突破千亿港元大关,上市以来股价累计涨幅达到惊人的500%。 对于这家公司,外界或许稍感陌生。其背后是一对父子组合:刘呈喜于2016年出资创办公司,但实际由其子刘志坚掌舵,历经十年终登IPO舞台。一路走来,迅策科技身后汇聚了庞大的投资方阵,如今市值相较A轮估值已飙升500多倍。 其中,作为第一大机构股东的腾讯无疑是最大赢家,单笔投资浮盈超过50亿元;知名PE机构K

2026-04-26 19:25:21  |  6 阅读

黄仁勋解析AI成本谜题:天价硬件如何产出廉价Token

想明白这个看似矛盾的说法,关键在于理解一个核心逻辑:硬件属于一次性投资,而Token则是持续性产出。英伟达推出的GB200 NVL72服务器,单价突破300万美元大关,堪称当今最昂贵的商用AI设备。然而这台"天价设备"在全速运转状态下,每秒可产出150余个Token。以全天候24小时运行来估算,其年度Token产量堪称海量,摊薄到每个Token上的成本微乎其微。举个形象的例子:花费百万元购入一台印钞设备,机器本身价格不菲,但印制出的每张纸币成本却仅有几分钱。英伟达的商业逻辑正是如此——投入的是昂贵的设备,

2026-04-26 14:13:08  |  6 阅读

代码产量暴涨背后:AI编程工具的高返工率隐忧

随着AI编程助手日益普及,人们开始重新审视软件开发生产力的评估指标。Waydev的研究表明,尽管AI代码的表面采纳率高达80%至90%,但实际有效采纳率却跌至10%至30%。GitClear一月份的报告指出,AI用户代码的修改频率是非AI用户的9.4倍;Faros AI在2026年3月的报告中提到,代码变更率飙升了861%。Jellyfish在2026年第一季度分析了7548名工程师的数据,发现其代码吞吐量翻了一番,但Token成本却增长了十倍。Atlassian去年斥资10亿美元收购DX,旨在评估AI的

2026-04-26 02:35:20  |  6 阅读

AI智能体架构探究:为何运营成本持续攀升

系列:AI智能体架构设计第十二篇:解析智能体使用成本上升现象主旨:相同任务执行,为何部分框架开销高出三倍——剖析Token消耗的深层架构成因,并探讨三种框架各自的成本优化策略适合人群:对智能体底层设计原理感兴趣,希望深入理解“为何如此设计”的读者预计阅读时长:15分钟一种令人困扰的计费模式语言模型的计费逻辑,与你通常认知的软件成本结构截然不同。常规软件中,购买一项功能后,使用频次与成本基本呈正相关。语言模型则不然,每次调用都需将完整的对话历史重新发送给模型——不仅限于你刚输入的语句,而是涵盖从对话起始至今

2026-04-25 22:19:29  |  6 阅读
海外评测解析DeepSeek-V4:开源智能体任务夺魁,幻觉增加,Token耗费较高

海外评测解析DeepSeek-V4:开源智能体任务夺魁,幻觉增加,Token耗费较高

每经编辑|兰素英 4月24日,DeepSeek-V4预览版正式发布并开源,声称在代理能力、世界知识和推理性能三大维度达到国内及开源领域的领先水平。 DeepSeek-V4提供Pro和Flash两个版本,均支持百万(1M)Token超长上下文。 两个版本均显著降低了对计算和显存的要求,将每个标记的推理FLOP削减73%,并将KV缓存内存占用减少90%。 4月24日,全球最大AI模型API聚合平台OpenRouter的数据显示,V4-Flash的调用量达270亿Token,V4-Pro为47.9亿Token,

2026-04-25 14:20:15  |  6 阅读

小白必看:一文掌握AI五大核心概念

AI这个概念如今无孔不入,但大多数人对其理解仍停留在“高科技”的浅层认知上。不必焦虑,本文通过生活化的比喻和直观图解,为你拆解最常用的5个AI核心术语,助你轻松驾驭国产AI工具,让工作学习事半功倍。AI(人工智能)AI即人工智能,简言之即赋予计算机模拟人类思考与感知的机能,使其具备识图、听音及自主解决问题的能力。不妨将其视为一个随时待命的超级大脑,只要给予充足的学习素材,它便能习得各类技能。当前国内主流的国产AI产品,如文心一言、豆包、通义千问等,广泛应用于写作、绘图及数据分析等领域,是日常工作学习的得力

2026-04-25 08:20:02  |  5 阅读

AI大模型实现“肌肉记忆”:Token使用量降低超七成,决策更精准

编者按:AGI时代正加速来临,智能系统从“工具”向“伙伴”转变,同时带来了许多亟待解决的核心问题:如何保证智能系统安全、可信、可控?如何在智能体之间(A2A)建立安全可信的交易支付体系?如何持续提升模型Token效率,让模型又快又准,加速智能体规模化应用?又如何通过高质量数据不断优化大模型性能?面对这些关键挑战,蚂蚁数科将携手高校推出系列技术研究《In Tokens We Trust》,聚焦上述前沿议题,分享我们在探索中的思考与实践。今天带来专题的第二篇:蚂蚁数科与中国科学技术大学的联合研究成果:让AI大

2026-04-24 19:50:21  |  5 阅读

Token太贵,我成了AI时代的局外人

AI用户,陷入焦虑漩涡“难道我不是付费会员吗?”3月11日晚上,苏玉望着显示屏上突然冒出的提示框,有些恼火。框内警告说,本周Token消耗已触及额度上限的九成,一旦额度耗尽,相关模型将暂停服务,直至下周额度重置。算力流转,费用攀升以Claude的计价规则为例,100个Tokens约等于75个英文词或50个中文字,而输出Token的单价是输入Token的五倍——这是最基础的折算方法。换句话说,AI每次回应都需要精密计算,后台的推理、检索、生成,甚至模型产生幻觉所浪费的Token,全部计入费用,最终化为实实在

2026-04-24 18:45:52  |  7 阅读

AI核心术语揭秘:词元(Token)的本质解读

掌握AI应用能力,已成为新时代党员干部的必修课。为深入贯彻习近平总书记关于人工智能发展的重要指示,助力全市党员干部提升AI认知水平与应用能力,培育"人人参与、积极探索"的学习生态,现推出"人工智能每周一课"专题,邀请您共同开启学习之旅。近期,由国家数据局正式命名的AI关键技术概念——词元(Token)引发广泛关注。数据显示,截至3月份,国内日均词元调用规模突破140万亿次,相较2024年初增幅超千倍。这一技术名词的走红,激发了公众对Token的浓厚兴趣。面对新兴技术,我们应保持开放态度积极应用,同时筑牢风

2026-04-24 18:09:08  |  6 阅读

AI领域要闻速览:国内首个Token园区项目启动,量子计算机融合AI,SpaceX太空算力计划

算力豹AI日报NEWSPAPER近期人工智能与算力领域动态一览01全国首个园区级词元(Token)生产基地正式启动包头市固阳县签约启动了国内首个园区级词元(Token)生产基地项目,该项目定位为“词元生产与运营中心”。此举意味着算力资源开始以“Token产出”的形式进行规模化整合与产业化布局。(图源:维度网)在模式规划上,该项目融合了运营、产品、算力与能源四方资源,提出了“输入电力、输出词元”的完整闭环路径。这一模式将传统能源优势与新兴算力需求相结合,旨在探索以绿色电力驱动人工智能计算产出的新型产业形态。

2026-04-24 16:04:11  |  8 阅读

中国AI大模型调用量三连冠揭秘

根据OpenRouter这一全球领先的AI模型API整合平台最新统计,在2026年3月16日至22日这一周,全球AI大模型总调用规模达到20.4万亿Token,较上周增长20.7%。在排名前十的AI大模型中,中国模型的周调用量高达7.359万亿Token,环比增幅达56.9%;而美国模型周调用量为3.536万亿Token,环比仅增长7.35%。至此,中国AI大模型周调用量已实现连续三周领先美国。中国AI大模型Token调用量为何能持续位居榜首?问题一:Token究竟是什么?"Token是大语言模型处理文本

2026-04-24 12:21:30  |  5 阅读

政府AI采购浪潮来袭:万亿级市场变革悄然开启

你或许对政府集中采购电脑、办公家具不陌生,但你可曾想过政府也会采购"大模型"?2025年8月,国务院发布《关于深入推进"人工智能+"行动的指导方案》,明确表态支持通过政府采购等途径,推动大模型服务在各行业的加速落地。紧接其后,2026年2月,国家发改委等8部门联合推出了《关于加速招标投标领域人工智能推广的实施意见》,明确要求在招标投标全流程中深入应用AI技术,涵盖招标规划、文件编制、智能辅助评审等20个关键场景。这意味着,从中央到地方,由政府订单驱动的AI采购浪潮正席卷而来。而这场变革的核心衡量标准,是一

2026-04-23 08:01:21  |  5 阅读

蚂蚁百灵发布Ling-2.6-flash模型 每百万token仅需0.1美元

【TechWeb】4 月 22 日消息,今日,蚂蚁百灵正式发布 Ling-2.6-flash,一款总参数量 104B、激活参数 7.4B 的 Instruct 模型。该模型主打“Token 效率(Token Efficiency)”,在保持竞争力智能水平的同时,更快、更省以及更适合大规模真实应用。 根据权威三方评测Artificial Analysis 数据,Ling-2.6-flash 展现了突出的 Token Efficiency 优势,以 15M output tokens 实现了 26 分 的 I

2026-04-22 21:12:47  |  7 阅读

硅基流动推“Token工厂”,让AI能力像水电一样普及

随着AI技术的飞速渗透及智能体(AI Agent)的全面爆发,算力、模型与应用的对接方式正在经历深刻变革。Token(词元)充当了技术供给与商业需求之间的“结算货币”。截至2026年3月,我国日均Token调用规模突破140万亿,较2024年初激增逾1000倍,这表明AI发展已步入以推理和应用为主导的爆发期。 在此环境下,AI基础设施的重要性愈发凸显。作为行业创新者,硅基流动确立了“Token工厂”的定位,旨在重塑AI服务的价值创造与分配机制。近期,该团队负责人详细阐述了这一模式的核心理念、商业价值及未来

2026-04-22 16:57:22  |  5 阅读