标签

AI视频技术新进展:Google Omni模型与实用工作流解析

发布时间:2026-05-16 19:10来源:微信阅读:8

https://www.youtube.com/watch?v=l8_0cyTaPY4

本期《AI Film News》重点涵盖以下几个方面:

Google 新模型疑似外泄 据传 Google 将在 I/O 大会推出名为Gemini Omni的视频模型。该模型可处理视频、图像、音频输入,在对话界面生成内容,有别于传统"首帧+提示"方式。外泄视频中展示教授在黑板书写场景,流畅度表现突出(如动作连续),但仍存在不足(如一笔成形X)。作者拿其与Seed Dance 2.0比较,发现 Google Omni 稍占优势,但仍有改进空间。

Krea 2 图像模型 对比 GPT-2 与 Nano Banana 2 Krea 发布新平台 Krea 2,核心功能为Mood Board(情绪板)风格控制。作者尝试了"废弃商场""1950年代跳舞人群""银翼杀手风格"等关键词。测试结果如下:

实用 AI 工作流程分享

AI 代理(Agentic Workflow)挑战 Runway 和 Dradia 均发布 AI 代理功能。作者指出当前多数 AI 代理增加了操作复杂度,因此发起挑战:首位在评论区分享真正节省时间成本的 AI 代理案例的用户,将获得100美元奖励。

行业资讯与活动

本周精选 AI 影片