标签

2026年7月1日人工智能科技快讯

发布时间:2026-07-01 09:06阅读:2

🔔1、Claude Code更新后默认后台运行子智能体,显著提高研发效率

💡核心要点:Claude Code新版本将默认在后台调度子智能体,能同步执行代码重构、单元测试、提交PR等任务,无需占用用户对话窗口。内部数据显示工具让工程师产出提升三倍,Spotify七成代码PR由AI辅助完成,团队配比从1名产品对接8名工程师调整至1:20。

📌阅读详情

🔔2、Cursor与OpenClaw同时推出移动端AI编程应用

💡核心要点:Cursor推出了iOS付费客户端,支持语音/斜杠指令唤醒本地、云端Agent,可远程操控电脑代码工程,云端任务隔离运行并生成日志;OpenClaw同步发布移动版本,移动端正式成为AI编码工具核心流量入口,本地云端任务支持双向迁移。

📌阅读详情

🔔3、华为发布920亿参数openPangu-2.0-Flash开源模型

💡核心要点:华为开源了openPangu-2.0-Flash,开放完整权重、推理代码与昇腾专属算子,依托昇腾原生算力打造智能体底层底座。Pro版本将于7月上线,下半年持续新增开源组件,面向全球开发者开放反馈通道。

📌阅读详情

🔔4、美团发布1.6万亿参数国产大模型LongCat-2.0

💡核心要点:LongCat-2.0总参数1.6万亿、激活48B,国内首个五万卡国产算力完整训练的万亿级模型,原生支持1M超长上下文。依托LSA稀疏注意力等自研架构专攻代码智能体,多项编程评测领先GPT-5.5,OpenRouter调用量跻身全球前三。

📌阅读详情

🔔5、虎牙发布VAM 1.0实时数字人,单张照片生成全天候互动形象

💡核心要点:基于DiT架构的VAM 1.0仅输入单张人像,即可生成支持唱跳、实时对话的数字人,28帧流式输出、首帧延迟1.3秒,8卡H20集群稳定运行。覆盖直播带货、新闻播报等场景,原生支持全双工打断交互。

📌阅读详情

🔔6、Hermes发布MoA混合智能体架构,性能超越Opus 4.8

💡核心要点:Hermes上线了MoA混合智能体,可自由组合多款开源模型分工协作,参考模型输出意见、聚合模型统筹决策。在全新行业基准中得分超过Claude Opus 4.8与GPT-5.5,交互页面质感提升,但算力耗时、使用成本同步上涨。

📌阅读详情

🔔7、小红书发布RedKnot推理引擎,显著优化长文本处理效率

💡核心要点:RedKnot重构了KV Cache存储机制,长上下文处理效率翻倍,提升首字生成速度与单卡并发承载量,解决大模型长文本推理卡顿、算力浪费问题,面向全行业开发者开源。

📌阅读详情

🔔8、OpenAI推出首款编程硬件Codex Micro定制键盘

💡核心要点:OpenAI推出了与Work Louder联名客制键盘Codex Micro,深度适配Codex编程工作流,旋钮可调节AI生成创造力,一键完成纠错、版本回溯。硬件战略双线布局,B端推出开发配件,C端联合Jony Ive研发下一代AI原生手机终端。

📌阅读详情

🔔9、豆包App增加原生地图导航,AI超级应用完善工具生态

💡核心要点:豆包接入了百度地图能力上线内置导航,无需跳转第三方App,通过自然语言完成路线规划、出行查询。产品持续加码工具属性,推进办公、出行等全场景一站式AI服务布局。

📌阅读详情

🔔10、三星、SK海力士、美光被控串通操纵DRAM内存价格

💡核心要点:三家存储巨头遭消费者集体诉讼,指控借转型HBM高带宽内存压缩普通DRAM产能,四年价格暴涨700%,2026年合约价持续大幅上涨。行业高建厂门槛叠加出口管制,机构预测高价周期将延续至2027年。

📌阅读详情

🔔11、Anthropic透露洽谈太空合作,计划按量结算

💡核心要点:Anthropic负责人称当前模型能力仅完成10%研发目标,正在与SpaceX开展太空相关业务洽谈。团队计划放弃传统Token计费,落地基于产出结果的定价方案,同时回应Claude Fable下架并非营销操作。

📌阅读详情

🔔12、国内发布七项AI智能体互联互通国标

💡核心要点:国内出台了智能体统一国家标准,规范智能体身份识别、跨设备协作、第三方工具调用规则,打通不同厂商Agent生态壁垒,为自主决策、多任务协同类AI产品提供标准化落地依据。

📌阅读详情

🔔1、ebook2audiobook:电子书转语音工具

💡功能亮点:开源电子书转语音工具,支持EPUB、PDF、MOBI等多种格式,自动按章节拆分生成朗读音频。支持1100+种语言方言,基于XTTS V2引擎提供高质量语音合成与声音克隆,支持ASMR、雨天氛围等风格化朗读和模型微调,适合听书制作、无障碍阅读和内容创作场景。

📌链接地址:https://github.com/DrewThomasson/ebook2audiobook

🔔2、hoppscotch:开源API调试工具

💡功能亮点:轻量级开源API调试工具,是Postman的免费替代方案,支持直接在浏览器中使用,界面简洁启动快速,覆盖HTTP、GraphQL、WebSocket等多种协议,提供环境变量、请求历史、自动化测试、云端同步等功能,支持团队协作,适合开发者接口调试场景。

📌链接地址:https://github.com/hoppscotch/hoppscotch

💡论文摘要:我们提出 Wan-Streamer,一个原生流式、端到端的交互式基础模型,旨在从头开始为实时、低延迟、全双工的音视频交互而设计。Wan-Streamer 在单个 Transformer 中无缝地将语言、音频和视频作为输入和输出进行建模,其中序列表示为交错的视觉、音频和文本输入 token,以及视觉、音频和文本输出 token,并通过块因果注意力协调,以实现增量流式处理。与依赖单独的 VAD、ASR、语言、TTS、音频驱动动画或视频生成模块的级联交互系统不同,Wan-Streamer 不依赖外部语言、语音、虚拟形象或视频生成模块:感知、推理、生成、响应时间、轮次管理和跨模态同步在一个统一模型中共同学习,从而减少了流水线延迟和错误累积。为了支持自然的音视频响应能力,我们围绕流式处理能力重新设计了整个技术栈,包括因果编码器、因果解码器、块因果注意力以及低延迟多模态 token 调度,从而实现了在 25 帧/秒下最短 160 毫秒的流式处理单元。Wan-Streamer 实现了约 200 毫秒的模型侧响应延迟,当结合 350 毫秒的双向网络延迟时,总交互延迟约为 550 毫秒,支持亚秒级的双工音视频通信。这些结果使 Wan-Streamer 定位为一个统一的、端到端的多模态交互式基础模型,用于低延迟流式交互。

图1: Wan-Streamer将交互建模为连续的因果流,其中用户观察和智能体响应(涵盖文本、音频和视频)以160毫秒的单位交错进行。

📌 链接地址:https://arxiv.org/abs/2606.25041