标签

AI周报 | 千问桌面版推出语音转文字功能;字节全模态大模型Doubao-Seed-2.0-lite亮相

各位朋友好,今天为大家汇总近期人工智能领域的重点资讯,涵盖办公效率工具、前沿大模型、开源项目、硬件发展等多个方向,每条内容都是精华,帮助大家快速了解行业最新趋势~8 大领域 · 全方位覆盖左侧是原始的口语化信息,右侧是经千问 AI 语音输入处理后的规范结构化文档,清晰展示语音转文字的内容整理能力。多模型在数学、物理、医疗、视觉感知等多维度 Benchmark 测试的数据对比表,清晰呈现 Doubao-Seed-2.0-lite 的性能优势。OpenSearch-VL 项目论文首页,展示了研发团队构成、项目

2026-05-11 14:27:52  |  5 阅读

(第268期)MRC开源与多项更新:AI日报速看

AI日报 2026年5月8日1.OpenAI携手多家厂商发布MRC协议,直击AI超算网络痛点。5月6日晚,OpenAI联合AMD、博通、英特尔、微软、英伟达等公司发布开放网络协议MRC,并已覆盖OpenAI全部前沿模型训练超算。MRC基于RoCE扩展,结合多平面网络与SRv6源路由,让数据在海量路径间分流,从而在微秒级别规避链路故障;同时仅需两层交换机即可搭建可达十万GPU规模的超算体系。该方案能够缓解网络拥塞与故障中断,降低运维复杂度,使大模型训练更高效、更稳定推进,也标志着AI基础设施正在以更标准的方

2026-05-08 11:57:36  |  5 阅读

AI日报速览:语音输入上新,全模态与AI搜索升级

1.千问PC端上线AI语音输入功能,用户可通过快捷键在各类桌面应用中直接使用,具备出色的语义理解能力,能把口语内容整理成结构化信息,同时还能用语音指令完成多种办公操作,显著提升日常效率。亮点提要:🗣️ 千问语音输入可对口语内容进行去语气词、纠错与格式化整理,并能结合上下文进行更贴合的回应。📝 用户能够用语音指令直接在多种应用里调用千问,实现创作、问答、翻译等常见任务。📧 千问还能自动生成邮件回复,覆盖钉钉、微信或邮件等办公场景,帮助用户更快处理沟通。2.字节跳动发布全模态大模型Doubao-Seed-2.

2026-05-07 16:32:09  |  4 阅读

NVIDIA重磅开源多模态与机器人技术引爆AI新浪潮

2026-05-07 · 综合整理自 Hugging Face Papers、TechCrunch、arXiv、NVIDIA Blog、Reuters 等本周,NVIDIA 在人工智能的开放生态领域动作频频,接连推出了三款重磅级产品,覆盖了从模型研发到安全框架,再到机器人平台的全面布局。Nemotron 3 Nano Omni:单一模型实现文本、图像、视频、音频全模态处理4月28日,NVIDIA 正式发布了 Nemotron 3 Nano Omni(https://developer.nvidia.com

2026-05-07 06:19:01  |  5 阅读

AI前沿:顶级模型折戟ARC-AGI-3,Meta机器人布局提速

📅 AI快讯 · 2026年5月2日ARC-AGI-3基准测试令顶尖大模型集体"露馅"——GPT-5.5与Claude Opus 4.7的得分双双低于1%,反观人类却能轻松满分通关。与此同时,Meta斥巨资收购机器人AI企业,GPT-5.6及Claude新一代模型接连浮出水面,AI竞赛的战火愈燃愈烈。Meta正式宣布并购专攻机器人智能的初创企业Assured Robot Intelligence,其核心技术团队将整体并入Meta超级智能实验室,与2025年组建的Meta机器人工作室展开深度协作。Assur

2026-05-02 20:21:16  |  4 阅读

高德地图重磅推出“AI伴行”:首个全模态出行智能助手

新浪科技4月30日消息,高德地图正式上线“AI 伴行”产品,该产品具备多模态交互能力,能实时感知用户位置与周边环境,并利用摄像头解析街景。作为行业首个面向真实世界的出行伙伴,高德正致力于将导航服务升级为懂现实的 AI 助手。 在日常生活中,常有人站在路口不知往哪走。AI 伴行能提供更直观的指引,将抽象方向转化为用户眼前的具体参照物,从而降低理解难度。 面对复杂的出行计划,它能理解多重意图并提供路线建议;在景区游览时,它还能充当实时导游,规划路线并标注核心景点。此外,它支持视觉识别功能,用户对准建筑拍照询问

2026-04-30 21:24:23  |  6 阅读
富瑞看好MiniMax-W,予“买入”评级,目标价1118港元

富瑞看好MiniMax-W,予“买入”评级,目标价1118港元

富瑞研究报告指出,MiniMax-W(00100)全模态模型具备独特的传播效应,并能增强模型智能;公司聚焦于智能提升(如LLM、编码)和创意增强(如影片、语音、音乐),终极目标是达成通用人工智能(AGI)及提升经济效益(GDP的百分比),给予该股“买入”评级,目标价1,118港元。报告指出,即将发布的新模型备受关注,预计M3.0和Hailuo 3.0将于年中前后推出,认为MiniMax展现了强大的执行能力,并通过协同的闭环模型与框架提供更优的用户体验。这一整合将成为另一加速引擎,因为框架能够捕获高价值的真

2026-04-25 10:49:22  |  7 阅读

红熊AI完成2.1亿A轮融资,估值达15亿元

编译整理:Stark瞰未来4月7日,红熊AI正式宣告完成2.1亿元A轮融资,由华禹创投担任领投方,老股东格睿丰投资、稼沃资本继续跟投,徐汇资本、上汽美元基金、嘉铭浩春、誉华资产等多家机构共同助力。此轮融资后,红熊AI的估值攀升至15亿元,累计融资规模逼近4亿元。身为成立仅两年的企业,红熊AI拟在2026年底冲击AI独角兽席位,预期ARR营收将超2亿元。公司核心壁垒在于打破传统AI的桎梏,将“记忆科学”与“全模态大模型”深度整合。该技术路径不仅化解了AI在感知、决策及行动层面的闭环难题,更依托“低成本硬件+

2026-04-13 10:49:19  |  4 阅读

影响力聚焦 | 模思智能:引领全模态人工智能浪潮

免责声明:入驻创营漕河泾AI校友中心(人工智能)上海市徐汇区古美路1528号A6栋北杨创智未来中心(人工智能)上海市徐汇区华发路699号漕河泾国际孵化中心(机器人、AI医疗器械等应用)上海市徐汇区桂平路418号未来42·超创中心基地(未来智能终端、器官医疗)漕河泾创业中心大厦(电子信息)上海市徐汇区桂平路680号32-33幢新业坊Lab.中科技物联创中心(空间信息)上海市虹口区汶水东路937号虹口新业坊12号楼新业坊Lab.源创孵化器(在线新经济)上海市宝山区逸仙路1328号新业坊.源创6号楼上海退役军人

2026-04-10 18:38:34  |  8 阅读

千问AI全模态突破,话费充值享优惠

3月30日,阿里千问迎来两项重要更新。当晚,阿里千问正式发布全模态大模型 Qwen3.5-Omni,同日,千问App接入支付宝AI付,推出充话费限时立减活动。Qwen3.5-Omni 实现全模态能力突破,可无缝理解文本、图片、音频及音视频输入,还能生成带时间戳的细粒度音视频字幕。该模型 Plus 版本在音频、音视频相关任务中拿下 215 项 SOTA,在音频理解、推理、对话、翻译等方面全面超越 Gemini3.1-Pro,音视频理解能力也达到其水平。它自然涌现出 Audio-Visual Vibe Cod

2026-04-03 09:49:32  |  8 阅读

AI全球资讯0403

全球TOP5 AI媒体头条: 1.IEEE Spectrum: 人工智能与人类合作完成21世纪菲尔兹奖获奖证明的首次形式化验证。 2. MIT Technology Review: 发布2026年“十大突破性技术”。 3. The Verge: AI代理成为2025年的关键趋势。 4.VentureBeat: Claude Code更新了MCP支持。 5.AI News: OpenAI GPT-5实现了全模态无缝交互。 国内TOP5 AI媒体头条: 6.机器之心:揭晓2025年度“AI中国”榜单,智象未来

2026-04-03 07:05:00  |  11 阅读
阿里推出Qwen3.5-Omni,多模态性能领先

阿里推出Qwen3.5-Omni,多模态性能领先

新浪科技讯 3月31日上午消息,阿里巴巴发布了新一代全模态大模型Qwen3.5-Omni,在音视频理解、识别和交互等215项任务中表现卓越,超越Gemini-3.1 Pro,成为全球领先的全模态大模型之一。 据了解,该模型具备强大的音视频理解和实时交互功能,能够生成详细且可控的结构化描述,支持多达113种语言和方言,并具备音视频Vibe Coding能力。用户只需对着镜头表达需求,模型就能自动生成App、网页或游戏代码。目前,阿里云百炼已提供Qwen3.5-Omni的Plus、Flash、Light三种A

2026-03-31 08:54:26  |  12 阅读
MINIMAX-W盘中涨幅突破6% MaxClaw接入个人微信 推出全模态模型统一订阅方案

MINIMAX-W盘中涨幅突破6% MaxClaw接入个人微信 推出全模态模型统一订阅方案

MINIMAX-W(947.5, 31.00, 3.38%)(00100)盘中涨超6%,截至发稿,股价上涨3.11%,现报945港元,成交额4.13亿港元。 MiniMax3月23日宣布,旗下AI Agent产品MaxClaw支持接入个人微信。至此,MaxClaw已覆盖微信、飞书、钉钉、企业微信、Telegram、WhatsApp 等主流即时通讯渠道。此外,MiniMax宣布将此前的Coding Plan全面升级为Token Plan,即全球首个支持全模态模型的统一订阅计划。升级后,Plus及以上套餐用户

2026-03-24 10:44:33  |  15 阅读