标签

AI头条速览|2026年4月29日(周三)

发布时间:2026-04-29 06:40来源:微信阅读:6

主编:Kiwi|出品:海风企业AI落地实验室

Manus收购被叫停

外商投资安全审查办公室作出禁止投资决定,并提出需撤销Manus收购相关交易

历史意义:《外商投资安全审查办法》落地后,首个公开被暂停的AI领域外资并购案

监管关注点:Manus核心团队、研发能力由中国境内转向境外所带来的潜在风险

📊影响评级:⭐⭐⭐⭐⭐(政策信号非常强)

中国成全球开源AI最大贡献者

Hugging Face 2026春季报告:平台内中国模型下载量占比达到41%

覆盖技术降本、工业级落地、端侧适配等多方向升级

其中41%的下载量来自中国研发的模型,中国正成为全球开源大模型供给中最活跃的区域

📊影响评级:⭐⭐⭐⭐⭐(生态层面实现突破)

AI政务正式进入"全场景落地"新阶段

广东省人工智能应用对接大会在深圳举行

覆盖科技、制造、医疗、教育、政务、农业、养老等7大领域

深圳福田区已落地21项AI应用,备案大模型15项(占深圳1/3)

全国率先推出**"AI数智员工"**

📊影响评级:⭐⭐⭐⭐(政策与场景双重驱动)

燧原科技、智元机器人、禾赛科技等机构入选

涉及集成电路、生物医药、人工智能、数字经济等战略性新兴产业

燧原科技:8年自主研发4代架构5款云端AI芯片,已打造万卡级算力集群

智元机器人:具身智能赛道的头部企业

📊影响评级:⭐⭐⭐⭐(产业集群加速成形)

从智能制造到系统能力的整体重构

2025年全年营收64.52亿元,机器视觉出货量超1000万台

在国内市场中,平均每2台工业相机、每3台移动机器人就有1台来自海康机器人

新厂投用后就开始寻找下一阶段:桐庐基地原计划支撑5年,如今可能只能用到2-3年

📊影响评级:⭐⭐⭐⭐(制造业AI化风向标)

排名

模型

厂商

综合得分

核心优势

开源状态

🥇

GPT-5.5

OpenAI

60.2

综合能力最强,推理顶尖

闭源

🥈

ClaudeOpus4.7

Anthropic

57.3

长文本、代码、Agent专精

闭源

🥉

Muse Spark

Meta

52.1

轻量高效,多任务均衡

闭源

4

DeepSeek-V4Pro

DeepSeek

51.5

数学推理极强,性价比最高

开源

5

GLM-5.1

智谱AI

51.4

代码与Agent专精

开源

6

Qwen3.6 Plus

阿里云

50.0

中文能力强,阿里云生态

开源

7

Grok 4.20

xAI

49.3

推理能力强,实时信息整合

闭源

8

MiMo-V2-Omni

小米

44.9

端侧适配好,多模态

开源

9

KATCoderProV2

KwaiKAT

43.8

性价比高,代码补全好

开源

10

Step 3.5 Flash

StepFun

38.5

速度极快,轻量部署

开源

排名

模型

厂商

综合得分

核心优势

许可证

🥇

Llama 4 Maverick

Meta

88.5

海外生态最丰富,多语言均衡

Llama 4 License

🥈

DeepSeek-V3.2

深度求索

87.5

数学与推理能力顶尖

DeepSeek License

🥉

Qwen3-72B

阿里云

87.2

中文第一,Apache 2.0可商用

Apache 2.0

4

Llama 4 Scout

Meta

85.3

轻量且能力强,消费级可跑

Llama 4 License

5

Qwen3-32B

阿里云

84.1

消费级显卡可流畅运行

Apache 2.0

6

Kimi K2.5

月之暗面

-

256K上下文,原生多模态

开源

7

GLM-5

智谱AI

-

SWE-rebench第一,长程任务稳

开源可商用

8

MiniMax M2.5

MiniMax

-

极速推理100TPS,编程极强

开源

9

Yi-Large 2

零一万物

-

中文语义、创作、对话顶尖

开源

10

Seed-Thinking-v1.5

字节跳动

-

AIME/Codeforces准确率>75%

开源

排名

模型

输入价格

输出价格

性能得分

性价比指数

🥇

DeepSeek V4 Flash

¥1.01

¥2.02

44.9

⭐⭐⭐⭐⭐

🥈

Qwen3.6 Plus

¥3.60

¥21.60

50.0

⭐⭐⭐⭐

🥉

GLM-5.1

¥10.08

¥31.68

51.4

⭐⭐⭐⭐

4

KATCoderProV2

¥2.16

¥8.64

43.8

⭐⭐⭐⭐

5

GPT-5.5

¥36.00

¥216.00

60.2

⭐⭐⭐(性能最强但价格最高)

排名

模型

厂商

Elo分数

核心优势

开源状态

🥇

Flux 2Dev

Black Forest Labs

1245

开发者首选,图像转图像和修复能力卓越

开放权重

🥈

Hunyuan Image 3.0

腾讯

1238

亚洲语言支持好,官方API稳定

权重开放

🥉

Flux 2 Schnell

Black Forest Labs

1232

极速生成(2-5秒),本地可跑

开放权重

4

Seedream 4.5

字节跳动

1225

创意美学强,风格迁移和参考能力好

部分开放

5

Stable Diffusion 3.5 Large

Stability AI

1198

完全开源,ControlNet生态最完善

完全开源

6

Flux 2 Max

Black Forest Labs

1168

开放权重巅峰,艺术风格范围最广

开放权重

7

Imagen 4

Google

-

生图质量比3高,速度比3快

闭源

8

Kolors

快手

-

中文理解强,国风表现好

开源

9

SDXL

Stability AI

-

生态成熟,LoRA和ControlNet丰富

开源

10

Playground v3

Playground

-

设计感强,UI/UX生成效果好

部分开源

场景

推荐模型

理由

本地部署(消费级显卡)

Flux 2 Schnell / SD 3.5

轻量,8GB显存可跑

商业API调用

Hunyuan Image 3.0 / Flux 2 Dev

中文好,API稳定

艺术创作/概念设计

Flux 2 Max / Seedream 4.5

艺术风格范围最广

电商产品图

Kolors / Hunyuan

中文商品理解强

ControlNet精准控制

SD 3.5 Large

生态最完善

排名

模型

厂商

Elo分数

核心优势

开源状态

🥇

HappyHorse 1.0

前阿里淘天团队

1333(T2V)/1404(I2V)

2026.4.8登顶双榜第一,开源模型首次击败所有闭源产品

完全开源+商用授权

🥈

LTX-2.3

Lightricks

1290

22B双流架构,生成速度快

开源

🥉

SkyReels V4

昆仑万维

1245

短剧生成最强,商业化成熟,月活8000万+

开源权重

4

可灵 v3-omni

快手

-

智能分镜、多图参考、主体绑定、4K输出

API开放

5

Seedance 2.0

字节跳动

-

运动质量高,人物一致性好

闭源

6

Wan2.6

阿里巴巴

-

部分开源,运动质量中等

部分开源

7

Pika 2.0

Pika Labs

-

特效丰富,创意视频

闭源

8

Runway Gen-4

RunwayML

-

真实感最强,电影级输出

闭源

9

Sora

OpenAI

-

理解力强,物理模拟好

闭源

10

HunyuanVideo

腾讯

-

中文场景理解好

开源

排名

模型

厂商

特色

核心优势

开源状态

🥇

LongCat-AudioDiT

美团

3.5B/1B

Seed基准SOTA,零样本音色克隆SIM 0.818

完全开源

🥈

OmniVoice

小米

-

支持600+语言,58万小时数据训练

开源

🥉

Step-Audio

阶跃星辰

-

Hugging Face全球热度Top 5,产品级语音大模型

开源

4

VoxCPM2

OpenBMB

2B

Tokenizer-free,30+语言+9大方言,48kHz高保真

开源

5

IndexTTS-2

IndexTeam

-

零样本语音合成,音色克隆+情感迁移+语速调节

开源

6

VoxCPM-1.5

OpenBMB

-

44.1kHz专业级音质,效率优化

开源

7

CosyVoice 2

阿里巴巴

-

阿里系TTS,中文自然度高

开源

8

GPT-SoVITS

社区项目

-

中文圈最流行的低成本音色克隆方案

开源

9

Fish Speech

Fish Audio

-

实时语音合成,延迟低

开源

10

ChatTTS

社区项目

-

中文对话场景专用,自然度高

开源

排名

模型

厂商

SWE-Bench

核心优势

开源状态

🥇

ClaudeOpus4.7

Anthropic

54.5%

复杂项目理解,长代码链推理

闭源

🥈

GPT-5.5

OpenAI

56.1%

综合能力最强,但价格最高

闭源

🥉

MiniMax M2.5

MiniMax

80.2%

编程极强,推理速度100TPS

开源

4

GLM-5

智谱AI

42.1%

Agent专精,长程任务稳定性第一

开源

5

DeepSeek-V4Pro

DeepSeek

46.4%

数学+代码双强

开源

6

KATCoderProV2

KwaiKAT

38.3%

性价比高,代码补全好

开源

7

CodeLlama 70B

Meta

-

开源代码模型标杆

开源

8

StarCoder2

HuggingFace/ServiceNow

-

多语言代码,企业级

开源

9

WizardCoder

微软

-

复杂算法实现能力强

开源

10

Mistral Large 2

Mistral AI

-

欧洲合规首选,轻量高效

开源

排名

模型

厂商

多模态能力

核心优势

开源状态

🥇

GPT-5.5

OpenAI

文本+图像+音频+视频

全模态理解最强

闭源

🥈

Claude Opus 4.7

Anthropic

文本+图像

视觉推理顶尖,图表分析强

闭源

🥉

Kimi K2.5

月之暗面

文本+图像+视频

256K上下文,VideoMMMU 86.6%

开源

4

Gemini 3.1 Pro

Google

文本+图像+音频+视频

原生多模态,Google生态整合

闭源

5

Qwen3.5 Omni

阿里云

文本+图像+音频

全模态统一架构,成本低

开源

6

GLM-5V

智谱AI

文本+图像

中文视觉理解强

开源

7

Yi-VL

零一万物

文本+图像

中文场景表现好

开源

8

InternVL

上海AI Lab

文本+图像

学术benchmark强

开源

9

Llama 4 Scout

Meta

文本+图像

轻量多模态,本地可跑

开源

10

MiMo-V2-Omni

小米

文本+图像+音频

端侧适配好

开源

场景

第一选择

备选

理由

日常对话/写作

DeepSeek V4 Flash

Qwen3-72B

1块钱百万Token,中文好

代码开发

Claude Opus 4.7

GLM-5 / MiniMax M2.5

SWE-Bench第一,Agent能力强

长文档分析

Kimi K2.5

Claude Opus 4.7

256K上下文,200万字

图像生成

Flux 2 Dev

Hunyuan Image 3.0

本地+API双支持

视频生成

可灵 v3-omni

HappyHorse 1.0

中文场景+智能分镜

语音克隆

LongCat-AudioDiT

OmniVoice

开源SOTA,600+语言

多模态理解

Kimi K2.5

Gemini 3.1 Pro

视频理解强,成本低

高并发/成本敏感

DeepSeek V4 Flash

Qwen3.6 Plus

极致性价比

复杂推理/科研

GPT-5.5

DeepSeek V4 Pro

综合能力天花板

HappyHorse 1.0 首次在视频领域击败所有闭源模型

中国模型占Hugging Face 41%下载量

Llama 4、Qwen3、GLM-5等开源模型能力正逼近闭源方案

DeepSeek V4 Flash:¥1.01/百万Token,性能44.9分

GPT-5.5:¥36/百万Token,性能60.2分

性价比差距达36倍,企业做选型必须把成本纳入考虑

2026年新模型几乎都支持文本+图像

视频理解能力成为新的竞争焦点(VideoMMMU基准)

语音模型迎来爆发(600+语言、零样本克隆)

Qwen3-72B:中文第一

Hunyuan Image 3.0:亚洲语言支持表现突出

可灵 v3:中文视频场景最强

免责声明:本次排名基于公开benchmark数据,具体效果会随不同场景而变化。主编:Kiwi|审核:海风 更新时间:2026-04-28 22:30(Asia/Shanghai)