人工智能晨讯 2026年4月10日
1、字节跳动推出原生全双工语音模型Seeduplex4月9日,字节跳动正式发布原生全双工语音大模型Seeduplex。据了解,与上一代半双工豆包端到端语音模型相比,Seeduplex采用了全新的“边听边说”架构设计,显著提升了交互的自然感和流畅度。目前,Seeduplex已在豆包应用全面上线,标志着全双工技术正式从实验室走向市场,在行业内率先实现大规模应用,为数亿用户带来连续且高质量的实时语音交互体验。(上海证券报)2、腾讯发布QClaw V2重大更新腾讯宣布QClaw V2大版本正式发布,新版(V0.2
字节Seeduplex全双工语音模型发布,豆包通话实现双向实时交互
字节于今日正式揭晓其原生全双工语音大模型Seeduplex。相较此前的半双工豆包端到端语音方案,Seeduplex采用“同步听说”的创新架构,使得交互的流畅性与真实感获得显著增强。官方表示,Seeduplex主要达成了两大技术突破:多项综合测评表明,Seeduplex在对话流畅性与节奏把控方面,明显超越传统半双工模式及市面主流应用的语音通话能力;在停顿判断精准度上,较半双工方案提高8%,呈现出更贴近真人对话的时机把握能力。同时,大规模A/B测试结果揭示,相较于先前上线的半双工版本,Seeduplex使用户
AI 早报:2026年4月9日
Meta 推出闭源大模型 Muse Spark。4月8日,该实验室发布新品,由前Scale AI CEO Alexandr Wang 领衔。该模型在算力大幅降低的情况下,实现了媲美 Llama 4 中型变体的性能,尤其在多模态和医疗领域表现优异。后续将融入 Meta 旗下社交生态,推动股价上涨 6.5%。智谱 AI GLM-5.1 开源登顶。4月8日,该模型开源,拥有 7540 亿参数。它支持长达 200K 的上下文窗口,在 SWE-bench Pro 测试中位列全球第三、国产及开源第一(超越 Claud
微软:AI语音交互距离成熟仍较遥远
微软(367.955, -6.38, -1.70%)指出,人工智能要实现真正自然流畅的语音指令体验,仍需经历较长的发展过程。这也反映出当下AI工具既具备潜力,也存在明显短板。 微软AI业务负责人穆斯塔法·苏莱曼表示,相关模型与智能体还需要经过大量训练,才能在口头交流中更精准地把握人类意图。他是在谈及微软新推出的语音转录模型MAI-Transcribe-1时作出这一表态的。 他进一步说明,核心难点在于语音在被转换成文本并交由AI系统处理的过程中,部分信息可能会流失。因此,转录环节成为提升语音助手和智能体能力
智谱GLM-5.1震撼发布!马斯克狂开7模型,阿里腾讯DeepSeek深夜决战
今日科技圈烽烟四起——智谱AI推出了能连续作业8小时的“数字劳工”,马斯克同步启动7个AI模型的训练,阿里、腾讯及DeepSeek在深夜展开激烈角逐,Meta更是豪掷150亿美元落地大模型。咱们逐一盘点。 --- 1. 智谱AI推出GLM-5.1:连续作业8小时,表现力压Opus 【事件简述】 4月8日,智谱AI正式揭晓新一代旗舰开源模型GLM-5.1,其最大亮点在于“长程任务”处理的突破,可在一个任务中连续自主工作8小时,产出完整的工程级成果。在模拟真实软件开发的SWE-bench Pro基准测试中,G
AI领域动态:Octo工具亮相,公众号严打AI写作,MMX-CLI发布
1、即梦AI推出协同叙事工具“小章鱼”Octo,首创VibeCreate创作模式2、反对“套壳”AI:微信公众号严厉打击非真人自动化写作行为3、MiniMax 发布 MMX-CLI:一行代码直接调用全模态模型4、Meta首次发布AI模型Muse Spark,千亿预算推进超级智能战略5、淘宝闪购商家端新增AI语音搜索,复杂任务实现“一问即办”6、Anthropic 上线 Claude Managed Agents 公开测试版,一站式解决 AI 代理部署难题7、腾讯云 QClaw V2 正式推出,引领多智能体
AI诈骗防范专题培训通知
为帮助老同志筑牢财产安全防线,守护家庭幸福,增强识别新型网络诈骗的能力,离退休第一党支部与理学院学生党支部将联合开展"AI诈骗:新型骗局揭秘"主题培训。具体安排如下:主题:AI诈骗新型骗局揭秘1.典型AI诈骗种类、行骗手段及真实案例分享2.AI换脸、AI语音等新型骗局识破方法3.现场互动答疑、个别咨询辅导参加人员:本校离退休教职工2026年4月10日(周五)15:00地点:离退休工作处西侧活动室场地限30人,培训结束后可获赠纪念品。欢迎相互转告。主办单位:离退休工作处2026年4月9日
豆包电话通话升级 接入Seeduplex大模型
4月9日午间,豆包官方宣布电话通话功能取得突破,成功引入全双工语音大模型Seeduplex。据悉,该模型具备原生全双工端到端特性,能应对复杂声学环境,精准抗干扰并动态判断停顿,从而带来更流畅、拟真的对话效果。接入后,豆包在对话自然度、反应速度及抗干扰方面均有显著增强,实现了真正的“边说边听”。 编辑:张乔松 新浪财经提示:本文转载自合作媒体,旨在传递更多信息,仅供参考,不作为投资建议。 郑重声明:1.严禁编造、传播虚假或误导性信息以扰乱市场;2.用户言论仅代表个人观点,与网站无关,不构成投资建议,用户需自
淘宝闪购AI店铺助手升级 语音搜索功能全面上线
新浪科技讯 4月9日上午消息,近日,淘宝闪购针对餐饮商家升级其AI Agent入口——AI店铺助手,正式推出语音搜索功能。该功能在业界率先实现直接调用执行窗口、形成复杂操作完整闭环的商家AI Agent服务。商家只需语音提问,AI店铺助手即可快速完成订单查询、商品管理、屏蔽恶意顾客等多项指令。据介绍,此项AI语音搜索功能依托于阿里巴巴百炼大模型的流式语音识别技术、千问大模型的语义理解技术,与端侧唤醒及意图解析的全链路深度整合,目标是为商家打造更自然、更高效的信息获取途径,帮助商家在日常运营中实现降本增效。
AI资讯速览:视频生成、智能体与大模型迎来新进展
🔔1、超越 Seedance 2.0!AI 视频领域又现神秘黑马 Happy Horse💡核心要点:在AI视频生成赛道中,新模型Happy Horse整体表现已超过Seedance 2.0,在文生视频的画面稳定性、细节呈现以及动作流畅度方面更具优势,还可结合音频生成实现多模态创作。其背景尚未明朗,外界猜测或出自亚洲某AI实验室,被认为有望成为Seedance的重要竞争者,并在全球AI社区引发广泛讨论,成为行业升级的重要信号。🔔2、15秒1080P音画同步!爱诗科技 PixVerse C1 亮相:影视级大模
初探人工智能
「 初探人工智能」人工智能01一、人工智能的定义人工智能(Artificial Intelligence,简称AI)的概念最早可以追溯到1956年的达特茅斯会议。在那次会议中,十位科学家探讨了利用机器模拟人类学习及其他智能活动的可能性。通俗地讲,人工智能就是利用人造机器(计算机)来模拟和延伸人类的智能。AI的发展主要致力于模拟和拓展人类智能,涵盖了听(语音识别、翻译等)、说(语音合成、人机交互等)、看(图像与文字识别等)、思考(对弈、专家系统等)、学习(模型迭代、检索等)以及行动(机器人应用、自动驾驶等)
走出人工智能的认知迷雾
编者述若用通俗说法,人工智能即"人造的智能",其智能水准无需与人类智能看齐。或许在大众认知中,唯有自动驾驶、AI芯片才算"人工智能"。实则不然!若将这些视为高端AI,那更多低调务实的AI早已默默改变着我们的生活。例如,AI技术帮助光伏企业天合光能将电池片优品率提高7%,使橡胶混炼合格率上升5%。这类应用虽不引人注目,但与需长期巨额投入的自动驾驶、智能芯片相比,AI已实质性地重塑众多产业的制造与供应链,创造真实价值。除"唯高端论"的误区外,投资过热亦成问题。据《2018中国AI商业落地报告》,2017年国内
杰富瑞看好Twilio:AI语音技术助其股价大涨
杰富瑞指出,伴随人工智能技术栈应用率的攀升,Twilio股价仍具备上涨潜力。 该机构将Twilio的评级由“持有”提升至“买入”,并预计目标价从125美元上调至160美元,预示着较上周四收盘价有22%的涨幅。 杰富瑞分析师周日发布研报称,鉴于对Twilio在语音AI技术栈中定位的信心增强,决定将评级上调至“买入”。 此外,他们指出,业务吸引力的小幅提升有望在未来数年成为持续增长的动力,从而助力业绩跑赢市场预期。 责任编辑:张俊 SF065 新浪财经声明:本文转载自合作媒体,旨在传递更多信息,内容仅供参考,
AI科普讲座走进校园
为传播科学理念,让青年学子近距离体验人工智能的独特魅力,4月1日,市科技馆特邀辽宁工程技术大学沈学利教授走进北港实验学校,举办了一场精彩纷呈的人工智能主题科普讲座。150多名师生汇聚一堂,共同探寻科技奥秘。讲座中,沈教授运用通俗易懂的表达方式,深入阐释人工智能的核心理念,协助同学们理清AI的科学定义。通过列举生活中的生动案例,他详细介绍了人工智能在交通、医疗、农业、安防等多个领域的实际运用,并重点讲解了计算机视觉、语音技术两大关键功能,让师生们对刷脸支付、智能音箱、拍照翻译、自动驾驶等日常AI应用场景有了
2026年4月5日人工智能领域动态汇总
Meta正式发布两款针对近视用户设计的处方版Ray-Ban Meta智能眼镜,型号分别为Blayzer Optics和Scriber Optics,并定于2026年4月14日发售,定价均为499美元。这一举措意味着AI可穿戴设备正在向更广泛的视力矫正用户群体渗透,使用者无需再佩戴额外眼镜就能享受AI带来的便捷功能。印度的电影产业正在大规模应用人工智能技术,以期显著压缩影片制作时间、降低制作成本,并高效完成多语种配音工作。由AI参与生成完整电影内容、智能化后期制作等新兴技术,正在深刻改变这个全球电影产量最高