标签

AI早报 06.18:Adobe全面升级AI助手,XDOF发力机器人数据基建

发布时间:2026-06-18 23:52阅读:1

Adobe 将 Firefly AI 助手扩展到了 Premiere、Illustrator、InDesign 和 Frame.io,并更新了 Firefly 的品牌套件、产品视频和故事板能力。

XDOF 正式发布,定位为机器人数据基础设施公司,提供数据采集、标注、遥操作和评估工具。公司已融资7000万美元,拥有约60名员工,服务20家客户,其中包括多家前沿 AI 实验室。它和 UC Berkeley 发布了 ABC 数据集,包含13万条轨迹、300小时仿真和100小时评估数据。机器人行业的短板正从“模型会不会学”转向“真实动作数据能不能持续获取”。

Pramaana Labs 获得2700万美元种子轮融资,聚焦于法律、税务、药物发现等高错误成本场景。其产品路线是普通 LLM 加确定性验证层,利用 Lean 风格的形式化规则检查模型输出。

DeepL 收购 Mixhalo,进入现场活动实时音频和翻译领域。Mixhalo 原本服务于体育赛事、会议和现场活动,用户通过手机接收现场音频;实时翻译的产品形态正从会议字幕扩展至演讲、展会、赛事和大型活动。

Odyssey 完成3.1亿美元 B 轮融资,估值14.5亿美元。它专注于世界模型,即 AI 对物理世界和空间变化的模拟能力:一个动作发生后,模型需预测环境接下来的变化。Odyssey 目前面向游戏创作、机器人和交互视频,AWS 是其首选云合作伙伴,模型针对 Trainium 芯片进行了优化。

SoftBank 在日本推出基于 OpenAI 模型的网络安全产品“Patching as a Service”。该服务源自 SoftBank Corp 和 OpenAI 的合资企业,旨在应对 AI 加速带来的网络攻击和关键基础设施安全需求。披露信息显示,项目目前约有50人参与推广,后续计划扩展至约1000人。

摩尔线程 MTT AICUBE 于6月18日开启预售,定位为家庭 AI 中枢,结合了 Agent、AI PC 和 AI NAS,内置60多个技能,并支持跨36个应用执行控制。

Adobe 此次更新的核心不在于单点生成能力,而是将 AI 助手深度植入 Premiere、Illustrator、InDesign 和 Frame.io 等现有生产工具中。Premiere 的助手能整理素材、重命名片段、识别采访问题并添加时间线标记;Illustrator 的助手可重组图层、检查缺失字体;Firefly 还新增了生成品牌套件、产品视频和故事板的功能。

创作者原本的流程涉及手动管理素材、图层、时间线、品牌元素和导出格式。如今,Adobe 试图让用户通过自然语言来驱动这些对象。

创意软件中的 AI 不能仅追求自动化,还需保留版本记录、撤销操作、品牌资产权限和人工确认。广告、电商和短视频团队将更早采用此类功能,因其工作包含大量重复的尺寸调整、格式修改、品牌规范套用和素材批量生成。

DeepL 收购 Mixhalo 后,产品场景从文档翻译、会议语音翻译拓展至现场活动。Mixhalo 的原产品是将现场音频传输至用户手机,适用于会议、体育赛事、音乐节和大型活动;DeepL 的能力则补充了实时翻译和语音转换功能。

限制主要在于延迟、现场噪音、专有名词、多人交谈以及网络稳定性。其付费方更可能是会议主办方、场馆、企业活动和赛事运营方,而非单个观众。

Odyssey 专注于世界模型。世界模型不同于普通视频生成,它需要理解空间、物体、相机运动和物理连续性。该公司过去通过类似街景采集的方式收集现实世界数据,现在将此能力应用于游戏创建、机器人训练和文本生成交互视频。

普通视频模型生成的是一段结果,而世界模型更像一个可交互环境。游戏和机器人都需要这种能力:角色移动时视角如何变化,物体被推动后如何运动,场景能否保持一致性。

短期产品化将首先发生在可控场景中,例如游戏原型、虚拟训练环境、机器人仿真数据和交互视频。难点仍在于数据覆盖、物理准确性、算力成本和版权边界。

Pramaana Labs 的路线是 LLM 加形式化验证。形式化验证可理解为将部分专业规则写成机器可检查的逻辑,使模型输出后经过确定性校验。目前它切入税务、法律、药物发现和网络安全等领域。

税务申报、法律条款、药物分子筛选不能仅依赖流畅文本。模型可负责读取资料、生成草稿和提出候选方案,验证层负责检查规则是否满足,专家则处理模糊和例外情况。

该路线的成本在于知识工程。每个行业都需要将规则、案例和专家经验转化为可检查的结构,维护成本不低。它更适合高客单价、高合规成本、错误后果明确的垂直场景。

XDOF 的重点在于机器人数据链路。它提供遥操作工具、数据采集流程、标注系统和评估工具,并与 UC Berkeley 发布了 ABC 数据集。该数据集包含13万条轨迹、300小时仿真和100小时评估,涵盖叠衣服、压平盒子、装载 AirPods 等真实操作任务。

机器人模型需要的不是互联网文本,而是“看见环境—理解动作—执行操作—得到反馈”的连续数据。VLA(视觉-语言-动作)模型即视觉、语言、动作的统一:先看见环境,理解指令,再生成动作。VLA 要落地,前面必须有稳定的数据层。

数据复用仍然有限。不同机器人拥有不同的机械臂、夹爪、传感器和控制接口,同一动作数据不一定能直接迁移。XDOF 的价值不仅在于出售数据集,更在于将采集、校准、标注和评估外包为基础设施。

SoftBank 推出的“Patching as a Service”面向日本市场,旨在帮助企业及关键基础设施应对安全漏洞。该服务来自 SoftBank Corp 和 OpenAI 的合资公司,披露信息显示,服务基于 OpenAI 模型,并围绕企业安全系统集成展开。

客户付费的理由并非“具备 AI 聊天功能”,而是漏洞发现、补丁优先级、修复建议和执行流程能否更快进入企业安全团队的工作台。安全产品的验收标准也不是回答是否自然,而是误报率、漏报率、回滚机制、审计记录和人工审批。

这个场景对 AI 权限要求极高。

摩尔线程 MTT AICUBE 于6月18日开启预售,产品形态为家庭 AI 中枢,组合了 Agent、AI PC 和 AI NAS。它内置60多个技能,支持跨36个应用进行控制。Skill 可理解为写给 Agent 的任务说明书:遇到某类任务时,应按什么步骤做、使用什么工具、如何检查结果。

该设备的切入点是本地数据和跨应用任务。照片、文档、家庭影音、个人文件和常用软件都在本地或家庭网络中,若 AI 能读取、整理并执行操作,用户流程便从“打开多个软件自行寻找文件”转变为“描述目标,由设备调用本地数据和应用完成任务”。

限制在于生态和权限。家庭 AI 中枢要真正可用,需要足够多的应用适配、稳定的本地模型能力、清晰的隐私边界以及用户能看懂的操作确认机制。跨应用控制越强,误操作和数据访问风险也越高。