AI视频技术新进展:Google Omni模型与实用工作流解析
https://www.youtube.com/watch?v=l8_0cyTaPY4
本期《AI Film News》重点涵盖以下几个方面:
Google 新模型疑似外泄 据传 Google 将在 I/O 大会推出名为Gemini Omni的视频模型。该模型可处理视频、图像、音频输入,在对话界面生成内容,有别于传统"首帧+提示"方式。外泄视频中展示教授在黑板书写场景,流畅度表现突出(如动作连续),但仍存在不足(如一笔成形X)。作者拿其与Seed Dance 2.0比较,发现 Google Omni 稍占优势,但仍有改进空间。
Krea 2 图像模型 对比 GPT-2 与 Nano Banana 2 Krea 发布新平台 Krea 2,核心功能为Mood Board(情绪板)风格控制。作者尝试了"废弃商场""1950年代跳舞人群""银翼杀手风格"等关键词。测试结果如下:
实用 AI 工作流程分享
AI 代理(Agentic Workflow)挑战 Runway 和 Dradia 均发布 AI 代理功能。作者指出当前多数 AI 代理增加了操作复杂度,因此发起挑战:首位在评论区分享真正节省时间成本的 AI 代理案例的用户,将获得100美元奖励。
行业资讯与活动
本周精选 AI 影片