OpenAI发布三款新语音模型 AI实现实时“边听边思考”
5月8日,OpenAI在Realtime API中一次性发布了三款前沿智能语音模型——GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,分别聚焦于语音交互对话、实时多语种翻译以及实时语音转写。这预示着智能语音技术已突破“仅能听懂”的局限,迈向了“边听边思考、边分析边执行”的全新境界。GPT-Realtime-2:AI终于掌握了边“听”边“想”的技能此次发布的“核心”无疑是GPT-Realtime-2。作为一个真正具备“人性化表达与执行力”
AI原生首届毕业生:OpenAI表彰高频用ChatGPT的26个团队
转眼间,首批「AI原生」本科生也快要毕业了。2022年入学的那一届,在校四年几乎都离不开ChatGPT的陪伴。就在这段时间,OpenAI推出「未来之星」计划,点名表扬了26位在大学期间高频使用ChatGPT的年轻人及团队。他们大多在二十岁左右,身上都带着明显的AI加持。过去四年,「AI到底要不要深度进入大学教育」的争论一直没有停过,双方都难以说服彼此。但从OpenAI给出的名单来看,或许结论已经更清晰了——AI时代的大学生,正在交出令人惊喜的成果:把150万个此前未被确认的太空目标的分布情况做成了图。Op
OpenAI 推出三款实时语音模型:翻译转写对话升级
5 月 7 日,OpenAI 一次性发布了三款全新语音 AI 模型,并向开发者开放 API 接入。与以往的渐进式改进不同,这次升级覆盖了从推理能力到底层机制,并重点强化实时翻译与流式转写等能力。对终端用户而言,这意味着你开口与 AI 交流时,它不仅能"听懂"你的意思,还能在语音场景下"完成任务",同时跨越语言差异——让语音真正成为人与软件之间更顺畅的沟通入口。其中 GPT-Realtime-2 被视为本轮的关键产品,也是 OpenAI 首款具备 GPT-5 级别推理能力的实
AI科技快讯:2026年5月7日
每天上午11点,精选10条AI资讯,带您开启智慧新一天。5月6日,大模型领域的独角兽企业Kimi(月之暗面)即将敲定新一轮约20亿美元的融资,由美团龙珠领投,中国移动、CPE等行业巨头深度参与。此轮融资结束后,Kimi的投后估值将正式突破200亿美元大关。在不足半年的周期里,Kimi累计融资额已超39亿美元(约合人民币376亿元),超越了MiniMax与智谱,位居国内大模型创业公司融资总榜之首。其ARR在两个月内由1亿美元攀升至超2亿美元,付费订阅及API调用均呈现加速增长态势。字节跳动估值破百亿美元耗时
2026年5月7日:全球AI产业加速,中美博弈与国产算力新高
大家早上好。今天是2026年5月7日,星期四。欢迎阅读人工智能早间快讯。“五一”长假过后,全球AI产业加速发展:Anthropic凭借“80倍年化增速”改变了行业排名,中美两国在最高层对话中纳入AI议题,同时国产算力创出新高——这三大信号相互印证,标志着由技术实力、产业落地和大国博弈共同推动的新阶段已然开启。5月伊始,全球AI治理面临关键转折。1. 中美贸易谈判拟设AI议题,大国协调取得突破。据《华尔街日报》5月6日消息,华盛顿和北京正在考虑启动人工智能正式对话,计划将AI纳入下周于北京举行的中美峰会重要
OpenAI发布GPT-5.5 Instant,Meta研发AI代理Hatch
1.【Meta研发AI代理Hatch】据消息源透露,Meta Platforms正在研发一款代号为“Hatch”的人工智能代理,预计将于6月底前完成内部测试。另外,Meta还计划在Instagram平台上发布一款基于代理技术的购物辅助工具。(界面新闻)2.【OpenAI发布GPT-5.5 Instant:幻觉降低52.5%,面向全员开放】5月6日,OpenAI宣布对其核心产品ChatGPT进行升级。新版GPT-5.5 Instant将在随后两天内对所有用户开放,并设为默认模型,同时向API开发者提供“gp
AI进化加速:人类该如何自处?
作为一个每天被AI消息轰炸的普通人,我忍不住想问:各位还hold得住吗?5月8日,OpenAI在旧金山开发者大会上正式发布GPT-5。官方说法是"突破通用智能关键阈值"。说白了,这玩意儿更聪明了,聪明到让人心里发毛。参数量直接冲到20万亿级别,融合了Transformer-XL与神经辐射场架构,支持文本、图像、视频、3D点云等10种以上模态输入输出。多模态推理精准度高达92%。更夸张的是,GPT-5首次内置"因果推断核心"。在医疗诊断场景中,误诊概率较GPT-4下降68%,直接达到专业医师水准。你还在担心
人工智能+动态复盘周报 | 4月27日-5月5日
1技术追踪(1)腾讯开源安卓端离线翻译模型4月29日,腾讯混元团队发布并开源翻译模型Hy-MT1.5-1.8B-1.25bit。该方案在体积极小的情况下,仅需0.4G便可完成33种语言的高质量互译,而且模型下载到手机后即可直接离线运行。此次开源还附带可实际使用的腾讯混元翻译Demo,并支持“后台取词模式”:当用户在本地查看邮件或浏览网页时,可随时调用混元翻译,无需网络、无需订阅,翻译流程全部在本地完成,不采集也不上传个人信息。Demo目前仅支持安卓体验,后续正式版将扩展至IOS等更多平台。(2)阿里推出Q
AI圈再起波澜:OpenAI新模型上线,后面还有更大动静
大家好,我是馨月,一位从零用AI切入各个赛道的实践者。每天只想把小白也能看懂的实操干货分享给你,这已经是日更第55天。5月6日,刚从五一假期回来没多久,AI圈就已经闹得沸反盈天,热度几乎要把天花板掀起来。今天这篇文章,我们把过去72小时里最值得你花时间关注的几件大事,给你一次性捋顺。无论你是想靠AI做“一人公司”的创业者,还是希望用AI帮企业降本增效的老板,今天的内容都能用上。---一、OpenAI再次“突袭”:GPT-5.5 Instant直接成默认模型先把最关键的消息抛出来。北京时间5月6日,Open
AI迎来“双重跃升”:ChatGPT更智能,医疗领域迎来颠覆性变革
在分诊台前,排队等候的患者仍有十几位,护士们步履匆匆,每个窗口前都挤满了人。按照往常的惯例,您可能需要等待半小时才能见到医生。然而,您可能不知道的是,就在您挂号的同时,AI已经悄然读取了您的症状描述、家族病史以及过敏记录,并正在将其与数十万个相似病例进行比对。这并非虚构的场景,而是2026年5月医疗现场的真实写照。恰在同一天,OpenAI宣布GPT-5.5 Instant已正式成为ChatGPT的默认模型。这意味着,全球数亿用户手中日夜相伴的AI助手,正经历一次重大的悄然升级。一边是与您日常生活息息相关的
OpenAI联发科联袂打造AI终端,智能革命将重塑生活
2026年5月,一则震动业界的消息不胫而走——缔造了ChatGPT传奇的AI领军企业OpenAI,正式宣告涉足硬件领域,拟在未来24个月内推出数以百万计的"AI代理手机"。更引人注目的是,台湾芯片巨头联发科已确定为这款颠覆性设备独家供应处理器。这绝非普通的跨界联手,而是一场即将引爆全球的智能变革。当人工智能不再局限于屏幕里的聊天窗口,而是深度融入你的随身设备与日常生活,所有规则都将被重新书写。是否还记得2022年末ChatGPT惊艳登场时带来的冲击?数月之间,用户数便突破亿级大关,AI对话迅速渗透进大众日
OpenAI连发两弹:GPT-5.5 Instant接棒默认模型,AI手机冲刺2027
今日AI界最重磅动态:OpenAI单日连抛两大动作——GPT-5.5 Instant全面接棒ChatGPT默认模型,同时据传正提速研发AI Agent手机,瞄准2027年规模化量产。OpenAI本周官宣GPT-5.5 Instant上线,取代GPT-5.3 Instant担当ChatGPT默认模型。这并非寻常的版本更新,而是于多项核心指标完成大幅跃升。关键革新:尤为关键的是,GPT-5.5 Instant大幅增强了"上下文管理"功能。它不再是缺乏记忆能力的聊天工具,而是能够智能调取过往对话记录以提供更具针
AI领域动态速览:豆包订阅定价曝光,GPT新版本登场,苹果或拥抱第三方AI
1、豆包披露付费订阅方案:月费68元至500元,分三档推进商业化2、OpenAI发布GPT-5.5Instant,取代5.3成ChatGPT默认模型3、拒绝“一家独大”,苹果 iOS 27 或将支持自定义第三方 AI 模型4、淘宝“答题免单”上线:每日两场,AI试穿玩法首次加入5、魔形智能完成数亿元Pre-A轮融资,布局Token基础设施6、重磅!谷歌神秘AI项目「Remy」曝光:Gemini驱动的 24 小时全时助教来了7、报道称谷歌推出新订阅服务 Gemini Ultra Lite,填补中高端市场空白
ChatGPT重磅升级:GPT-5.5 Instant默认上线,幻觉率骤降52.5%
IT之家5月6日报道,OpenAI于昨日(5月5日)发布通知,ChatGPT聊天机器人正式启用全新默认模型GPT-5.5 Instant,此次更新主打精准与精简,在与用户互动时特别削减了"冗余表情符号"的出现频率。就回答质量而言,GPT-5.5 Instant生成的文本更为凝练,在确保信息有效性的同时,大幅压缩了啰嗦的排版和多余表情符号的使用。此次迭代显著提升了事实精准度,针对医疗、法律、金融等高敏感度领域,OpenAI内部测试表明GPT-5.5 Instant的幻觉现象较上一代锐减52.5%。在经用户标
AI进化:从指令执行者到自主工作者
你是否曾觉得使用AI时,在编写提示词上耗费了大量精力?这并非你能力不足,而是AI不够“体贴”。以往,你需一步步指导它,它便按部就班地执行;若无明确指令,它便停滞不前。这场景,如同一个只会听令、缺乏主动思考的实习生。 4月24日,OpenAI推出了GPT-5.5,其官方公告开篇便宣称:“这是我们迄今为止最智能的模型。”然而,真正令人瞩目的并非仅仅是“更聪明”,而是它开始展现出“自主工作”的能力。 过去,你需要将一项任务分解为数十个细微步骤,并逐一输入给AI。如今,你只需清晰表达你的目标。例如,你可以说:“请