标签

NIST科技简讯:AI硬件前沿动态

NIST科技早报第 18 期前言立足技术前哨,洞察未来变革。聚焦人工智能、具身智能、智能软件等研究院重点发展的前沿科技领域,每周为您提供前瞻精准又有料的科技资讯,记得点赞关注!AI硬件播报——智能眼镜玄景MLVision M6发布时间:2026年1月发布亮点:全球首款支持硬件可持续升级的模块化AR眼镜。采用主机与显示模组分离的设计,核心M6 Air仅重36.8克,配备索尼IMX681传感器,支持第一视角拍摄与AI语音交互。需要AR功能时可磁吸接入单绿色或全彩Micro LED光波导显示屏,扩展信息阅读、实

2026-06-04 09:39:10  |  4 阅读

AI终端交互:下一个技术浪潮的制高点

AI行业正在经历一次静默的重心转移。最近一年多来,以语音为代表的对话式AI,正逐渐成为大模型落地的兵家必争之地。市场模型侧,放弃Sora的OpenAI ,前段时间一口气发布了语音推理、翻译、转写三款语音模型,补全交互入口的短板。市场也先后涌现出了硬件侧的plaud、软件侧的typeless输入法等红极一时的硅谷新贵。市场似乎正在悄然释放一个信息:对话式AI,或许会成为最早一批跑通AI PMF(Product-Market Fit,完成商业闭环)的玩家。近日,思必驰向上交所递交招股书,有望成为智能终端对话式

2026-06-01 18:24:02  |  2 阅读

FootApp:AI 驱动的足球赛事智能标注新方案

足球赛事的深度剖析极度依赖对球员个体行为及团队配合的精准标记。然而,完成一场 90 分钟比赛的标注往往需耗时 6 至 8 小时,涉及约 2000 个事件节点,这不仅成本高昂,且极易产生人为失误。鉴于此,意大利科研小组研发了一款名为 FootApp 的应用,它巧妙融合了语音交互、可穿戴传感技术与机器学习算法,为足球数据标注开辟了全新路径。研究背景与挑战足球比赛标注的核心宗旨在于完整复盘赛中发生的所有关键事件。通过对球员个人动作、团队协作模式及赛场动态数据进行标记并深入挖掘,能够生成评估球员表现、研判球队战术

2026-06-01 15:27:36  |  8 阅读

AI 穿戴设备:重塑人机交互新范式

点击上方蓝字 即刻关注人工智能穿戴装备正悄然革新大众与数字领域的互动模式。伴随智能眼镜、AI 耳机及随身助手的迭代升级,人们对手机屏幕的依赖频次正显著降低。这一潮流非一日之功,而是技术积淀、习惯演变与产业风向共同催化的结果。智能手机的中心地位会否动摇?业界主流观点认为,短期内手机不会被彻底替代。核心缘由在于:大屏依然是消费内容与执行复杂操作的首选载体;手机在算力储备与影像捕捉上依旧占据主导;娱乐游戏及办公生态在手机端仍拥有不可替代的优势。不过,用户的行为逻辑或将迎来重构:导航指引、消息提醒及即时检索等轻量

2026-06-01 00:33:04  |  6 阅读

AI日报速递|5月30日|OpenAI进军实时翻译,专用模型成新趋势

各位好,欢迎来到StarAI资讯站。今日AI圈相当精彩,OpenAI放出了大招,直接切入实时翻译领域。与此同时,国内这边,阶跃星辰也开源了一款性价比超高的Agent模型。接下来我们逐一了解。先快速浏览一下今日要点。第一,OpenAI推出了实时翻译模型,支持70种语言输入,翻译成13种输出语言。我认为这个信号比产品本身更值得关注,因为OpenAI正在走专用模型路线。第二,阶跃星辰开源了Step 3.7 Flash模型,近2000亿参数,但实际只激活110亿。在Agent评测中位居榜首,还能在Mac上本地运行

2026-05-31 08:36:31  |  21 阅读

AI智能体开发成本解析

评估一个AI智能体(AI Agent)的开发成本,很难给出固定不变的数字,因为它完全取决于系统的复杂程度、技术架构以及交付要求。从目前行业的普遍行情来看,AI智能体的开发成本可以大致划分为以下四个区间:构建AI智能体,资金主要流向哪些方面?主要可以拆解为以下四个维度:AI项目不仅需要前端和传统后端工程师,通常还需要:Prompt工程师 / AI产品经理:负责角色设定、工作流精细化调优和Token控制。算法/数据工程师:如果涉及知识库(RAG)向量化、模型微调(Fine-tuning)以及语音降噪、全双工断

2026-05-30 07:06:17  |  4 阅读

智能客服系统优势明显

✅ 全天候在线服务夜间、节假日、休息日……持续接待,用户体验显著提升↑✅ 智能对话交流准确理解客户疑问,自动检索回复,交流体验流畅~✅ 大量咨询无等待并发处理多通来电,客户无需等候,满意度快速提升📈✅ 无情绪波动、无差错不会烦躁、不会疲劳,同时自动生成分析报告辅助决策关键在于——AI无缝切换人工,人机协作高效简单咨询机器人处理,复杂问题立即转接人工流程支持深度定制化,数据清晰可见🔍真正实现企业沟通质量升级、效能倍增无论电商、教育或本地服务,都非常适用!

2026-05-18 11:34:13  |  5 阅读

AI 工具深度评测」系列第2期 豆包实测:字节系AI是否全能?全场景体验报告

本文属于「AI 工具深度评测」系列第二期,每周精选一款,助你降低试错成本。豆包初看显得"极易上手",使用一周后,感受转变为"确实依赖"。若你需要一款响应迅速、免费且覆盖全场景的 AI 助手,豆包或许是当下最"普适"的选择。它不追求单一领域的极致深度,而是力求在日常各类场景中实现"实用且顺手"。这是一款专为"大众用户"打造的 AI 工具。我耗时一周,暂时搁置手机浏览器和百度,将所有日常咨询优先交给豆包。"今日北京天气如何

2026-05-17 17:01:00  |  9 阅读

OpenAI三款语音模型重磅发布,GPT-Realtime-2引领智能交互新纪元

2026年5月8日,OpenAI重磅发布三款语音AI产品。「AI语音交互,彻底告别机械生硬感」并非微小的功能修补,更非挤牙膏式的更新——而是一次性推出三款产品,每一款都在重塑AI的听觉能力。GPT-Realtime-2具备GPT-5级推理能力 · 人声仿真度几乎等同于真人GPT-Realtime-2的核心突破在于:声音不再像机器人一样冰冷。这并非玄学,而是硬核指标。OpenAI的测试表明,Realtime-2在自然度、情感表达和对话流畅度三个维度上均有质的飞跃。通俗来讲:之前的AI语音是“照本宣科”,而现

2026-05-15 00:50:58  |  16 阅读

AI应用从概念走向实际交付

今日关键信号明确:AI agent 的竞争核心已从“能否执行”转向“能否在真实环境中稳定完成任务”。企业端正在完善流程、权限管理、上下文处理及变更控制;基础模型与工具链则持续增强多模态、语音、长上下文处理、结构化输出和安全自动化能力。真正决定差异的,不再是模型性能,而是谁能将 agent 稳定嵌入工作流中。一句话总结:AI 的主战场正从“展现智能”向“稳定执行”演进。Aaron Levie 明确指出:Anthropic 和 OpenAI 正推动企业内部部署 AI agents,但当前挑战已从“模型是否足够

2026-05-12 16:17:37  |  4 阅读

智能AI闹钟

1. 【AI大模型加持,随问随答的私教】 搭载AI大模型,一键唤醒就能对话! 语文、数学、英语、科学……孩子的“十万个为什么”,它都能耐心解答, 还能练口语、学翻译、讲故事,24小时陪伴式学习,把枯燥的知识变有趣! 2. 【K12全学段资源,同步学习不费妈】 内置K12乐园,小学到初中教材同步更新! 课前预习、课后复习、课文跟读、单词听写,海量内容持续更新, 在家就能同步课堂进度,再也不用追着孩子辅导作业~ 3. 【触屏+语音双控,孩子一用就会】 高清触摸屏搭配语音快捷指令, 喊一声就能设置闹钟、开启计时

2026-05-12 09:35:03  |  5 阅读

AI 观察:从对话工具迈向操作系统级生态

浏览完今日的资讯汇总,最深刻的体会并非某个模型性能再度跃升,而是 AI 正加速向操作系统底层收敛。它正逐渐集齐四大核心能力:能言、善记、可连、会行。这四项能力若单独审视或许不足为奇,但一旦融合,便产生了质的飞跃。当下最值得关注的,绝非单一维度的突破,而是多条技术路线并行推进后,AI 产品愈发呈现出真正操作系统入口的特质。语音交互不再局限于更自然的朗读,记忆功能超越了临时的上下文缓存,连接器不再是简单的插件堆砌,智能体的质量管控也不再仅依赖模型参数。当这些要素同步成熟,模型将不再仅仅是个问答工具,而是进化为

2026-05-11 14:43:28  |  4 阅读

智能英语学习应用的构建策略

构建一款智能英语学习应用,关键在于运用多智能体系统来复现真实教学场景。北京木奇移动技术有限公司作为专业软件外包服务商,期待与您探讨合作机会。根据您当前的五大功能模块设计,我们提供以下技术实现方案及国际化合规建议:智能口语陪练系统:核心技术:采用实时语音交互技术。为确保响应时间低于500毫秒,推荐使用整合语音识别、大语言模型和语音合成的端到端解决方案,或基于WebRTC协议优化传输效率。多智能体协同:设置'情绪调节师'(专注激励)、'知识指导员'(专注纠错)和'学习进度师'(专注流程)三类子系统,通过协同机

2026-05-11 08:09:20  |  5 阅读
彩讯股份Voice Agent多行业规模落地 助力企业降本增效

彩讯股份Voice Agent多行业规模落地 助力企业降本增效

新浪科技讯 5月9日下午消息,在近日的2026移动云大会上,彩讯股份(24.690, 0.00, 0.00%)在展区展示了从算力底座、平台搭建到AI应用落地的全栈能力。展会路演现场,彩讯语音智能体 Voice Agent 凭借语音交互能力与“感知-规划-执行”的智能闭环吸引目光。它不再局限于以往规则驱动的语音机器人(15.750, 0.33, 2.14%),帮助企业打造“懂业务、能长期执行”的专属数字员工。据介绍,该方案已在多个行业实现规模化应用,持续带动企业降本增效与智能化升级。 依托“感知-规划-执行

2026-05-09 19:15:23  |  4 阅读

OpenAI语音模型革新:AI助手争夺“听觉入口”新时代

硅基工具人语音入口再升级OpenAI于2026-05-07发布新语音模型与Realtime API相关能力,把实时对话、语音理解、翻译和转写放在同一次更新里。相比单独提升音色或识别率,这次更像一次面向应用层的补课:让模型听得更快,说得更顺,也能在对话中处理更复杂的任务。发布信息里最值得注意的是三款语音模型同时出现。它们覆盖实时语音、语音到文本等不同环节,指向的是一条完整链路。用户开口、系统理解、模型推理、再用声音回应,这几步如果拆开看都不新鲜,难点在于把它们压到一次自然对话的节奏里。语音交互对延迟的容忍度

2026-05-09 12:40:43  |  5 阅读