AI前沿速递 06.19|Jio通话嵌入AI助手,Snap分拆AI视频团队Dotmo
Reliance Jio 推出 Jio Call Agent,打算将 AI 助理无缝融入电话通讯。使用者能以 “Hey Jio” 唤醒助理,令其转换语音为文字、提炼重点,并执行打车、点外卖、定座位等指令。该功能并非独立应用,而是深度植入通信网络,面向 Jio 破 5 亿的庞大用户群,预计于今年末推出。
Jio 同步上线了 AI 版 MyJio 与 TeleFrame。前者支持运用自然语言办理 eSIM、漫游包等通信业务;后者为针对家庭的 AI 显示终端,借语音操控家庭备忘、日程规划、购物及娱乐等智能体。AI 触角正由手机端向通话与家庭屏幕延伸。
Snap 将其内部的生成式 AI 视频团队剥离,成立独立公司 Dotmo。Dotmo 将致力于研发赋能互动游戏体验的 AI 模型,Snap 提供技术授权且持有大部分股权,其 CTO Bobby Murphy 也将作为核心个人投资者入局。拆分的一大诱因是内部研发开销过高。
Pixi 上架 iOS 应用,允许用户借 iMessage 发送 AI 驱动的 AR 形象。这些形象绝非静态贴图,而是会借助接收者的 iPhone 镜头现身于真实场景中,并对声音、神态及周边物件做出回馈。官方称视觉与音频运算均在本地终端完成。
据 TechCrunch 消息,Elastic 应允以不超 8500 万美元吸纳 DeductiveAI。DeductiveAI 专攻 AI SRE,即运用 AI 侦测并修复软件系统异常。其技术有望被融入 Elastic 的可观测平台,用于自动监控性能瓶颈与处置系统宕机。
Amazon 正探讨将自研 AI 芯片 Trainium 售予外部客户。AWS 此前多靠云服务租赁芯片算力,若直接售卖硬件,将更直白地切入 Nvidia 的硬件版图。Amazon 坦承该探讨尚处萌芽期。
Jio Call Agent 的产品定位极其清晰:无需用户开启全新 AI 应用,而是将 AI 无缝植入电话沟通。用户于通话中唤醒助理后,它可记录对话、提炼摘要,并基于交谈内容落实后续动作,比如点餐、预订、打车。
传统电话仅充当沟通媒介,任务执行往往滞后于通话。用户挂断后,需自行记录要点、开启地图、外卖、日历或客服端。Jio 的逻辑是将“通话—记录—理解—执行”浓缩为闭环。
该产品的分发红利源于运营商网络。Jio 坐拥超 5 亿用户,AI 助理若作为通话功能上线,触达链路远短于单独下载应用。然其局限亦同源:通话内容、通讯录、订单、支付及位置皆属高敏数据,务必仰赖明确授权、透明记录及高危操作二次确认。
Pixi 切入的是聊天情境。用户发送的不再是 GIF、表情或短视频,而是一个可闯入对方真实空间的 AR 形象。收件方开启 iMessage 后,形象借镜头跃然于桌面或室内,可发声、可游玩,亦能依人神情与周遭物体变换反应。
此产品将 AI 内容由“生成供己观看”扭转为“发送予人交互”。它更似数字馈赠,而非内容创作利器。用户初衷并非制作专业影像,而是借生日、问候、戏谑、挚友互动缔造微型共享经历。
瓶颈在于社交频次与猎奇感。AR 形象初见虽惊艳,但长线留存仰仗形象库、交互脚本、生成耗费及平台分发。Pixi 相中 iMessage,皆因消息关系链已成,免去了重建社区之劳。
Snap 将生成式 AI 视频团队剥离为 Dotmo,意图绝非续作常规视频生成,而是研发能缔造互动游戏体验的 AI 模型。互动游戏对视频模型苛求更甚:画面须连贯,动作须受控,用户输入后环境须有响应。
普通 AI 视频仅输出固定片段,互动游戏则需模型持续消化状态更迭。角色行至何处、镜头如何摆动、物体受激后作何演变,皆须维持连贯。此路径更趋“可交互世界缔造”,而非单次文生视频。
Snap 拆分 Dotmo 亦折射出 AI 视频的高成本依旧左右组织架构。大厂内部留存研发实力,却将非核心商业路径剥离,可减轻财报重担,同时借股权锁定未来红利。
Amazon AI 掌舵人称,AWS 正探讨将 Trainium 芯片售予他企用于数据中心。Amazon CEO Andy Jassy 先前于股东信提及,若将芯片业务独立,并向 AWS 及第三方兜售,其年化营收增速约达 500 亿美元。
AWS 往昔更倾向将芯片包装为云服务一环。客户购入的并非芯片,而是算力、存储、网络、安全及监控打包之云方案。直售芯片将颠覆商业模式:Amazon 由云服务商向芯片供应商靠拢。
短期内,此仍处早期探讨期。Amazon 自身亦逢供给掣肘,Jassy 曾言当前 Trainium 产能及下代 Trainium4 产能皆迅疾售罄。芯片外售能否落地,仰赖产能、软件生态、客户自管集群意愿,及 AWS 舍弃部分云服务绑定收益之决断。
DeductiveAI 主攻 AI SRE。SRE 即站点可靠性工程,旨在护航线上系统平稳运行。AI SRE 意在使模型读取日志、指标、报错堆栈与系统态,自动锁定故障肇因,并输出修护方案或执行修复。
Elastic 核心产品为搜索、分析与可观测平台。可观测工具原仅告知工程师“何地生患”;DeductiveAI 类工具则企图再往前推进一步,告知工程师“何以生患、如何施治”。此与 AI 生成代码衍生之新患相连:代码产出提速,线上宕机、回归隐患及依赖冲突亦随之攀升。
边界系于自动修复权限。系统故障修复或涉回滚、重启、改配、扩容与改码,此等操作断难全权交予 Agent。更可行之初期形态乃自动诊断、生成修护策、创建工单与提交可审补丁。
Allbirds 已脱手鞋履主业,并更名 Smartbird。公司售出鞋业套现 4300 万美元,复从公开市场募资 1 亿美元,新帅 Nadia Carlsten 刚履新,正筹组 AI 基建团队。
Smartbird 志不在做常规 GPU 云,亦无意与大型 neocloud 打价格战。其锚定需直控服务器、重数据主权、难全倚公有云之企业客群,如制药、能源、金融及公共部门。目标客群所需为数百至数千卡规模之可控集群,而非无限膨胀之超大型云。
此案例更似“AI 基建利基市场”,而非消费品牌跨界神话。单租户部署客群愿为安全、合规、数据主权及可控性买单,然销售周期、交付实力及运维职责更沉。Smartbird 现处团队搭建期,能否跑通业务,视其能否将融资兑现为真实集群交付。
Salesforce 宣告拟约 36 亿美元吞并 Fin。Fin 核心产品为客服 AI Agent,覆盖 live chat、email、WhatsApp、SMS、phone 及 Slack 等渠径,可端到端化解繁复客诉;Salesforce 称会将 Fin 战力并入 Agentforce。
客服 Agent 乃当下最易商业化之企业 AI 场景之一。缘由极简:问题海量、流程标准、成效可量。客户愿否掏钱,不决于应答拟人度,而决于能否拉升解决率、压降人工转接、缩减响应耗时,且不滋生错退、妄诺与账号危机。
Fin 归入 Salesforce 后,客服 Agent 之争将多发生于企业软件入口处。独立 AI 客服产品须直面 CRM、工单、知识库、通话、聊天及权限系统之集成代价;软件巨鳄之长处为既有客户数据与工作流入口,风险则系产品整合速率与定价策略能否跟上 AI 原生企业之步调。