标签

AI日报:特斯拉接入豆包,美团试水万亿大模型

发布时间:2026-04-27 14:30来源:微信阅读:5

哈喽大家好,我是玖玖学长~本期给大家汇总最新一轮 AI 行业日报,内容覆盖大模型发布、车载智能升级、语音技术突破、数字人开源、电商风控 AI 等多个热点,帮助你快速看懂 AI 圈重点进展!

DeepSeek-V4 预览版已正式上线并开源,率先把 1M 超长上下文能力做成标准配置。依托结构层面的创新与 Agent 生态适配,模型的推理表现和落地效率都得到了明显提升。

该模型同时推出 Pro 与 Flash 两个版本,其中 Pro 版性能已经逼近全球头部闭源模型,Flash 版则强调更高性价比,可适配不同使用需求;配合 DSA 机制对长上下文进行优化,也进一步压低了计算开销。

特斯拉宣布,中国市场的车载语音服务已正式接入字节跳动旗下的豆包大模型;本次合作由 DeepSeekChat 提供 AI 互动能力,并采用双模型落地方案,是特斯拉在中国市场推进本土化的重要一步。

这一合作也在加快国产 AI 技术在车载场景中的商业化进程,推动自主车企、科技企业与 AI 创业团队共同参与车载智能的发展。

华为新一代鸿蒙座舱 HarmonySpace 6 正式亮相,在舱内感知、智慧交互和移动影音三大方向上实现全面进阶。

座舱智能体小艺采用最新 MoLA 2.0 架构,配合千亿参数级多模态大模型,理解、决策与执行能力同步增强,成为覆盖全场景的聊天型 AI 助理,用户开车时也能完成导航、控车、闲聊、生活服务等多项任务。

与此同时,舱内 AI 多模态感知系统 AMS 也一并搭载,实现全方位动作识别与生命体征监测;再加上行业首款双 17.2 英寸 3.4K 双联屏和 AI 调音魔方,车内影音体验进一步升级。

小米发布全链路语音大模型 MiMo-V2.5,全面覆盖 Agent 时代对语音输入与输出的需求,让声音成为可编程、可创作、可复刻的智能载体。

其中,MiMo-V2.5-TTS 系列实现了“语言即控制”的语音生成方式,可通过自然语言指令细致调整语速、情绪、语气等维度,甚至能“一句话生成新音色”;

MiMo-V2.5-ASR 开源模型则支持多种中文方言和中英混说场景,专业术语、歌词等内容也能做到流畅且准确的识别。

目前三款 TTS 模型均限时免费开放,ASR 模型的权重和代码也已全部开源,为 Agent 生态快速落地提供支持。

Soul AI Lab 正式开源业内首个 14 亿参数的实时数字人生成模型 SoulXFlashTalk,该模型具备亚秒级延迟与每秒 32 帧高帧率能力,为行业提供了一套完整的实时交互方案。

此次开源同步放出了项目页面、技术报告、源代码和模型权重,进一步降低了行业研发门槛;Soul 也表示会持续推进开源路线,促进 AI 与社交场景结合,完善多模态 AI 生态。

美团正在内部测试一款万亿级参数的新一代 AI 大模型,该模型完全基于国产算力集群训练,体现出对国产技术路线的认可。目前模型仅面向受邀用户开放,后续有望推动 AI 能力在更多场景中落地。

淘宝天猫已上线 AI 假图识别能力,可准确辨别 AI 生成图片和伪造凭证,有效遏制恶意退款,帮助商家守住权益。

该能力会通过千牛旺旺界面向商家提示可疑假图并发出预警,平台也能直接依据识别结果进行纠纷裁定,目前先向高评分商家开放,后续会逐步覆盖更多店铺。

万兴科技旗下万兴脑图也全新推出万兴脑图 AI 功能,成为国内首款支持 AI Agent 能力的专业思维导图软件。

这项功能以对话方式构建 AI 知识工作台,同时保留用户熟悉的手绘模式,公测期间收获了不少正向反馈,也进一步提升了软件的交互性与智能化水平,帮助用户更高效地完成思维导图搭建与管理,提升知识整理和办公效率。

从“会用 AI”升级到“靠 AI 拉开差距”,再叠加高阶 RAG 和智能体技能,你也能更快成长为职场稀缺型人才,轻松实现办公提速与岗位进阶。

以上就是本期 AI 日报的全部内容啦,关注学长,后续我会继续为大家带来最新的 AI 行业资讯~