AI视频技术新进展：Google Omni模型与实用工作流解析

发布时间：2026-05-16 19:10阅读：25

https://www.youtube.com/watch?v=l8_0cyTaPY4

本期《AI Film News》重点涵盖以下几个方面：

Google 新模型疑似外泄据传 Google 将在 I/O 大会推出名为Gemini Omni的视频模型。该模型可处理视频、图像、音频输入，在对话界面生成内容，有别于传统"首帧+提示"方式。外泄视频中展示教授在黑板书写场景，流畅度表现突出（如动作连续），但仍存在不足（如一笔成形X）。作者拿其与Seed Dance 2.0比较，发现 Google Omni 稍占优势，但仍有改进空间。

Krea 2 图像模型对比 GPT-2 与 Nano Banana 2 Krea 发布新平台 Krea 2，核心功能为Mood Board（情绪板）风格控制。作者尝试了"废弃商场""1950年代跳舞人群""银翼杀手风格"等关键词。测试结果如下：

实用 AI 工作流程分享

AI 代理（Agentic Workflow）挑战 Runway 和 Dradia 均发布 AI 代理功能。作者指出当前多数 AI 代理增加了操作复杂度，因此发起挑战：首位在评论区分享真正节省时间成本的 AI 代理案例的用户，将获得100美元奖励。

行业资讯与活动

本周精选 AI 影片

← 上一篇：AI时代领导者如何重建专注与幸福感下一篇：AI 变革下的深度洞察 →