2026年7月1日人工智能科技快讯

发布时间：2026-07-01 09:06阅读：2

🔔1、Claude Code更新后默认后台运行子智能体，显著提高研发效率

💡核心要点：Claude Code新版本将默认在后台调度子智能体，能同步执行代码重构、单元测试、提交PR等任务，无需占用用户对话窗口。内部数据显示工具让工程师产出提升三倍，Spotify七成代码PR由AI辅助完成，团队配比从1名产品对接8名工程师调整至1:20。

📌阅读详情

🔔2、Cursor与OpenClaw同时推出移动端AI编程应用

💡核心要点：Cursor推出了iOS付费客户端，支持语音/斜杠指令唤醒本地、云端Agent，可远程操控电脑代码工程，云端任务隔离运行并生成日志；OpenClaw同步发布移动版本，移动端正式成为AI编码工具核心流量入口，本地云端任务支持双向迁移。

📌阅读详情

🔔3、华为发布920亿参数openPangu-2.0-Flash开源模型

💡核心要点：华为开源了openPangu-2.0-Flash，开放完整权重、推理代码与昇腾专属算子，依托昇腾原生算力打造智能体底层底座。Pro版本将于7月上线，下半年持续新增开源组件，面向全球开发者开放反馈通道。

📌阅读详情

🔔4、美团发布1.6万亿参数国产大模型LongCat-2.0

💡核心要点：LongCat-2.0总参数1.6万亿、激活48B，国内首个五万卡国产算力完整训练的万亿级模型，原生支持1M超长上下文。依托LSA稀疏注意力等自研架构专攻代码智能体，多项编程评测领先GPT-5.5，OpenRouter调用量跻身全球前三。

📌阅读详情

🔔5、虎牙发布VAM 1.0实时数字人，单张照片生成全天候互动形象

💡核心要点：基于DiT架构的VAM 1.0仅输入单张人像，即可生成支持唱跳、实时对话的数字人，28帧流式输出、首帧延迟1.3秒，8卡H20集群稳定运行。覆盖直播带货、新闻播报等场景，原生支持全双工打断交互。

📌阅读详情

🔔6、Hermes发布MoA混合智能体架构，性能超越Opus 4.8

💡核心要点：Hermes上线了MoA混合智能体，可自由组合多款开源模型分工协作，参考模型输出意见、聚合模型统筹决策。在全新行业基准中得分超过Claude Opus 4.8与GPT-5.5，交互页面质感提升，但算力耗时、使用成本同步上涨。

📌阅读详情

🔔7、小红书发布RedKnot推理引擎，显著优化长文本处理效率

💡核心要点：RedKnot重构了KV Cache存储机制，长上下文处理效率翻倍，提升首字生成速度与单卡并发承载量，解决大模型长文本推理卡顿、算力浪费问题，面向全行业开发者开源。

📌阅读详情

🔔8、OpenAI推出首款编程硬件Codex Micro定制键盘

💡核心要点：OpenAI推出了与Work Louder联名客制键盘Codex Micro，深度适配Codex编程工作流，旋钮可调节AI生成创造力，一键完成纠错、版本回溯。硬件战略双线布局，B端推出开发配件，C端联合Jony Ive研发下一代AI原生手机终端。

📌阅读详情

🔔9、豆包App增加原生地图导航，AI超级应用完善工具生态

💡核心要点：豆包接入了百度地图能力上线内置导航，无需跳转第三方App，通过自然语言完成路线规划、出行查询。产品持续加码工具属性，推进办公、出行等全场景一站式AI服务布局。

📌阅读详情

🔔10、三星、SK海力士、美光被控串通操纵DRAM内存价格

💡核心要点：三家存储巨头遭消费者集体诉讼，指控借转型HBM高带宽内存压缩普通DRAM产能，四年价格暴涨700%，2026年合约价持续大幅上涨。行业高建厂门槛叠加出口管制，机构预测高价周期将延续至2027年。

📌阅读详情

🔔11、Anthropic透露洽谈太空合作，计划按量结算

💡核心要点：Anthropic负责人称当前模型能力仅完成10%研发目标，正在与SpaceX开展太空相关业务洽谈。团队计划放弃传统Token计费，落地基于产出结果的定价方案，同时回应Claude Fable下架并非营销操作。

📌阅读详情

🔔12、国内发布七项AI智能体互联互通国标

💡核心要点：国内出台了智能体统一国家标准，规范智能体身份识别、跨设备协作、第三方工具调用规则，打通不同厂商Agent生态壁垒，为自主决策、多任务协同类AI产品提供标准化落地依据。

📌阅读详情

🔔1、ebook2audiobook：电子书转语音工具

💡功能亮点：开源电子书转语音工具，支持EPUB、PDF、MOBI等多种格式，自动按章节拆分生成朗读音频。支持1100+种语言方言，基于XTTS V2引擎提供高质量语音合成与声音克隆，支持ASMR、雨天氛围等风格化朗读和模型微调，适合听书制作、无障碍阅读和内容创作场景。

📌链接地址:https://github.com/DrewThomasson/ebook2audiobook

🔔2、hoppscotch：开源API调试工具

💡功能亮点：轻量级开源API调试工具，是Postman的免费替代方案，支持直接在浏览器中使用，界面简洁启动快速，覆盖HTTP、GraphQL、WebSocket等多种协议，提供环境变量、请求历史、自动化测试、云端同步等功能，支持团队协作，适合开发者接口调试场景。

📌链接地址:https://github.com/hoppscotch/hoppscotch

💡论文摘要:我们提出 Wan-Streamer，一个原生流式、端到端的交互式基础模型，旨在从头开始为实时、低延迟、全双工的音视频交互而设计。Wan-Streamer 在单个 Transformer 中无缝地将语言、音频和视频作为输入和输出进行建模，其中序列表示为交错的视觉、音频和文本输入 token，以及视觉、音频和文本输出 token，并通过块因果注意力协调，以实现增量流式处理。与依赖单独的 VAD、ASR、语言、TTS、音频驱动动画或视频生成模块的级联交互系统不同，Wan-Streamer 不依赖外部语言、语音、虚拟形象或视频生成模块：感知、推理、生成、响应时间、轮次管理和跨模态同步在一个统一模型中共同学习，从而减少了流水线延迟和错误累积。为了支持自然的音视频响应能力，我们围绕流式处理能力重新设计了整个技术栈，包括因果编码器、因果解码器、块因果注意力以及低延迟多模态 token 调度，从而实现了在 25 帧/秒下最短 160 毫秒的流式处理单元。Wan-Streamer 实现了约 200 毫秒的模型侧响应延迟，当结合 350 毫秒的双向网络延迟时，总交互延迟约为 550 毫秒，支持亚秒级的双工音视频通信。这些结果使 Wan-Streamer 定位为一个统一的、端到端的多模态交互式基础模型，用于低延迟流式交互。

图1: Wan-Streamer将交互建模为连续的因果流，其中用户观察和智能体响应（涵盖文本、音频和视频）以160毫秒的单位交错进行。

📌 链接地址：https://arxiv.org/abs/2606.25041

← 上一篇：AI时代下技术如何加剧性别偏见下一篇：深度解析：AI产业链全景图谱与生态演变 →