国信互联网人工智能周报:科技巨头竞逐AI新基建
报告发布日期:2026年4月12日 报告名称:《国信证券-人工智能周报(26年第15周):腾讯正式发布"龙虾"QBotClaw,Meta发布收款AI模型MuseSpark》
证券分析师:张伦可 陈淑媛 王颖婕 刘子谭 张昊晨
证券投资咨询执业资格证书编码:S0980521120004 S0980524030003 S0980525020001 S0980525060001 S0980525010001
核心观点
人工智能动态:
1)公司动态:OpenAI 正式发布ChatGPT的苹果CarPlay适配版本;Runway发布Multi-Shot App;谷歌发布首款离线AI听写应用 Eloquent;ElevenLabs 推出 iOS 应用 ElevenMusic;腾讯正式发布“龙虾”QBotClaw;阿里Wan2.7-Image、Wan2.7-Video视频生成模型发布;美图AI开放平台发布Meitu CLI;火山引擎Seedance 2.0正式面向普通API客户开放申请;阿里云旗下AI Agent产品JVS Claw正式推出移动端App。
2)底层技术:微软开源前沿语音AI家族 VibeVoice;Meta发布首款AI模型Muse Spark;谷歌正式发布 Gemma4开源大模型;Anthropic 测试“龙虾”Conway;腾讯云推出“龙虾”记忆服务Agent Memory;字节跳动发布原生全双工语音大模型Seeduplex;阿里千问 3.6-Plus正式发布;美团 LongCat-AudioDiT 开源。
3)行业政策:广东:多地“设局”超级试验场,领跑OPC生态建设;北京:海淀首推“模型券”惠企,加速大模型商业化落地;四川:重金布局底层数据基建,突破高质量语料瓶颈。
风险提示:政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行风险,游戏公司新产品不能如期上线或表现不及预期风险等。
AI相关网站流量数据
公司动态
OpenAI 正式发布 ChatGPT 的苹果 CarPlay 适配版本。
4月1日,OpenAI 对 iOS 版 ChatGPT 应用进行了重大更新,新增对苹果 CarPlay 的原生支持。这一更新让驾驶员可以在行车过程中通过语音与 ChatGPT 进行深度交流,同时遵循苹果的严格规定,确保驾驶安全。ChatGPT 目前不支持操控车辆硬件或 iPhone 系统功能,而是作为一位知识渊博的“副驾乘客”,专注于提供信息咨询、行程规划或创意启发。
Runway 发布 Multi-Shot App。
3月30日,Runway 推出的 Multi-Shot App 是 AI 视频生成领域的重要突破,它通过集成对话、音效及自动化剪辑技术,使用户仅凭一段场景描述即可直接获得具有电影质感的完整短片。该应用简化了传统视频制作流程,降低了短视频创作门槛,并预示着 Generative Video 正在从素材生产向叙事创作代理进化。
谷歌发布首款离线 AI 听写应用 Eloquent。 4月7日,谷歌发布首款离线 AI 听写应用 Eloquent:手机秒变专业速录员。该应用基于谷歌轻量化模型 Gema 构建,实现 100% 离线工作,有效解决数据泄露问题,并具备自动剔除语气词和文本润色功能,满足专业用户需求。
ElevenLabs 推出 iOS 应用 ElevenMusic。 4月3日,ElevenLabs 推出的 ElevenMusic 应用标志着其正式进入 AI 音乐创作与社交发现领域,直接参与与 Suno 和 Udio 等平台的竞争。该应用允许用户通过自然语言提示词生成定制化音乐,并支持调整曲目长度、歌词开关及艺术风格。此外,它还整合了流媒体社交属性,提供实时电台、预设专辑及基于情绪维度的精选歌单。
腾讯正式发布“龙虾”QBotClaw。 4月8日,腾讯正式发布国内首个支持主流大模型API自由配置的AI浏览器‘龙虾’QBotClaw,标志着浏览器从单纯的网页访问工具演变为具备全场景感知与复杂任务执行能力的AI助理。该产品核心亮点在于其极高开放性,支持用户自由配置国内各大主流大模型的API Key,打破了以往AI浏览器与单一模型深度绑定的局限。
阿里Wan2.7-Image、Wan2.7-Video视频生成模型发布。 4月1日,阿里发布Wan2.7-Image大模型,突破AI生成图像的局限,实现个性化表达和高质量艺术创作。4月3日,阿里通义实验室推出的Wan2.7-Video视频生成模型,通过先进的技术解决了AI视频创作中的内容不专业和修改困难问题,为创作者提供了更高的自由度和灵活性。
美图AI开放平台发布Meitu CLI。 3月31日,美图AI开放平台发布Meitu CLI工具,标志着其核心影像能力实现标准化封装。首批美图AI Skills已同步登陆ClawHub并全面接入OpenClaw龙虾生态,开放包括AI图像、视频、设计在内的8种场景化影像能力。此次发布的核心在于通过“开箱即用、按量付费”的轻量化模式,打破了高阶视觉生产的技术门槛,使“一人公司”与初创团队能够以极低成本构建专业级视觉内容生产工作流。
火山引擎Seedance 2.0正式面向普通API客户开放申请。
4月2日,字节跳动火山引擎正式开放Seedance 2.0 API服务,标志着其多模态视频生成模型从封闭体验向开放生态转型,为开发者和企业提供更强大的视频创作工具。
底层技术
微软开源前沿语音 AI 家族 VibeVoice。 3月30日, 微软开源了名为 VibeVoice 的前沿语音 AI 模型家族,涵盖 ASR 和 TTS 等多项能力,具有长音频处理、多说话人自然对话生成和低延迟等特性,单次处理 90 分钟多说话人对话,GitHub 迅速获 27K Star,迅速在开发者社区引发关注。
Meta发布首款AI模型Muse Spark。 4月9日,Meta正式发布首款自研高性能AI模型Muse Spark,标志着扎克伯格在千亿级投入下的“超级智能”版图迈出实质性一步。该模型由Scale AI创始人Alexandr Wang领衔研发,目前已集成至Meta AI服务中,技术层面采用多子智能体协同机制,能够同步处理旅行规划、目的地对比等复杂长链任务,并在视觉理解方面表现卓越。
谷歌正式发布 Gemma4开源大模型。
4月3日,谷歌正式发布了其开源生态的最新旗舰大模型Gemma4。此次同步推出了四种不同参数规格,以精准适配从端侧设备部署到云端复杂推理的各种需求。其中,表现最为亮眼的31B(310亿参数)版本在多项权威基准测试中表现优异,成功跻身全球开源大模型综合能力榜单第三位。这一成绩不仅被业内视为对Meta Llama系列开源霸主地位发起的一次强力阻击,也充分展示了谷歌在高质量训练数据过滤和模型蒸馏技术等开源生态领域的深厚积淀和技术实力。
Anthropic 测试“龙虾” Conway。
4月2日,Anthropic正在开发名为Conway的常驻代理解决方案,旨在为Claude打造一个始终在线、独立运行的智能环境。Conway将拥有独立的UI实例,支持浏览器操作、外部连接器连接以及Claude Code功能,同时通过Webhook实现自动化响应,并推出CNW ZIP标准以增强扩展性。
腾讯云推出 “龙虾” 记忆服务Agent Memory。
4月3日,腾讯云推出了“龙虾”记忆服务——TencentDB Agent Memory,为 OpenClaw 系统增添了强大的长期记忆能力。这项创新的记忆引擎采用了四层渐进式记忆系统,使 AI 助理能够更好地理解和记住用户的需求。Agent Memory 服务的推出,使 OpenClaw 的回答准确率达到了76.10%,相比原有的记忆系统提升了近59%。
字节跳动发布原生全双工语音大模型 Seeduplex。
4月9日,字节跳动发布原生全双工语音大模型 Seeduplex,标志着 AI 语音交互从传统的“回合制”向更贴近人类直觉的“实时自然交互”演进。该模型通过语音与语义的联合建模,显著提升了模型在复杂声学环境下的抗干扰能力,并引入动态判停技术,优化对话节奏控制,提升用户体验。
阿里千问 3.6-Plus正式发布。
4月3日,阿里正式发布千问3.6-Plus,这标志着国产大模型在代码生成、逻辑推理和Bug修复等编程领域实现了重大突破。在全球权威的大模型盲测榜单(如LMSYS的编程子榜)中,它力压众多海外竞品登顶中国最强编程模型,其卓越表现也助推阿里在全球AI实验室综合排名中升至第四。
美团 LongCat-AudioDiT 开源。
4月2日,美团 LongCat-AudioDiT 开源项目通过创新的波形潜空间扩散建模技术,彻底抛弃了传统TTS模型依赖的梅尔频谱中间表示层,直接在波形层面处理以阻断级联误差,实现了语音克隆性能的重大突破。其3.5B版本在零样本(Zero-shot)语音克隆测试中创下新的业界最佳纪录,在Seed-ZH测试集上的说话人相似度指标飙升至0.818,在Seed-Hard测试集上也达到了0.797。
行业政策
中央网信办、国家发展改革委印发《政务领域人工智能大模型部署应用指引》。10月10日,中央网信办、国家发展改革委联合印发《政务领域人工智能大模型部署应用指引》,旨在安全稳妥推进政务领域大模型部署应用。指引从场景牵引、规范部署、运行管理三方面提供导向,要求政务部门结合实际选择典型场景探索应用,统筹集约部署,建立全周期管理体系,防范“数字形式主义”及泄密等风险。
陕西省规划到2027年建立5个人工智能学院。10月8日,陕西省教育厅发布《陕西省推进"人工智能+教育"行动计划(2025—2027年)》,计划到2027年建立5个左右人工智能学院,同时在中小学培育20个全国人工智能教育基地,职业院校建设10个"AI+专业群"及虚拟仿真实训基地,高校布局60个优质学科专业,并培养500名骨干教师、打造100所实验学校,推动教育高质量发展。
重点事件预告
10月23-24日:2025中国工业AI大会 (IAIC2025)
10月31-11月1日:ROSCon China 2025
风险提示
政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。
免责声明
国信互联网张伦可团队-成员介绍
张伦可
国信互联网首席分析师
分析师资格编码:S0980521120004
香港科技大学投资管理学硕士、加州大学欧文分校经济学学士,2021年加入国信证券经济研究所,2023年9月起担任互联网行业首席分析师,聚焦研究国内互联网巨头和人工智能产业趋势的发展。加入国信证券以前,曾任职于中信建投国际(香港)、Roth Capital(美国),具备海内外券商从业经历擅长挖掘困境反转的机会,聚焦研究先进生产力、具备独特性和可持续性发展的企业。重点覆盖腾讯、美团、阿里、Meta、微软等企业。
陈淑媛
国信证券互联网分析师
执业资格编码:S0980524030003
新加坡南洋理工大学硕士。覆盖公司:腾讯控股、美团、快手、网易、BOSS直聘腾讯音乐、云音乐、微博、知乎、美图、Adobe等。
王颖婕
国信证券互联网助理分析师
清华大学硕士,主要研究电商、互联网医疗等。覆盖公司:阿里巴巴、美团、京东集团、拼多多、京东健康、阿里健康、唯品会、SEA等。
刘子谭
国信证券互联网助理分析师
上海交通大学机械与动力学院硕士,研究方向人工智能、机器学习。4年新能源汽车、智能驾驶工作经验。覆盖公司:META、微软、英伟达、谷歌、亚马逊、百度集团、金蝶国际等。
张昊晨
国信证券互联网助理分析师
执业资格编码:
S0980525010001
上海财经大学金融硕士,研究方向美股科技、电商等。覆盖公司:亚马逊、谷歌等。