模速×追梦 AI 开放麦:揭秘视觉语言模型的注意力迷失
模速 × 追梦 AI
网络直播
视觉语言模型在注意力机制里的迷失之谜
本次直播将深入探讨视觉语言模型(LVLM)面临的关键瓶颈——为何高性能模型会在注意力机制中“迷失方向”?奚工理将进行全方位解析,从注意力余诊断入手,搭建统一的解释架构,并展望多模态模型的未来演进路线。
1
直播亮点
LVLM 的主要难点:跨模态对齐的现实困境
注意力余诊断: pinpoint 模型“分心”的根源
统一解释架构:重塑对注意力机制的认知
未来走向:构建更高效、更具可解释性的多模态架构
2
直播详情
受众群体:AI 科研人员、算法工程师、多模态行业专家
播出时间:5 月 14 日(周四)14:00
参与方式:扫码预约