评测_标签-酷阅新闻

可靠人工智能 | 迪博技术顺利通过信通院智能体安全评估

（以下资讯由厂商提供）深圳市迪博技术有限公司系国家级专精特新重点"小巨人"企业，身为全国信标委人工智能分委会委员单位及大数据标准工作组全权成员单位，致力于人工智能全栈解决方案的开发。公司独立研发法象大模型、数据工厂、智能工厂与智能体引擎等AI应用生态技术架构，凭借自有的自然语言处理专利，攻克智能文档结构化核心技术，达成文档要素的精确提取与对齐，打破行业信息处理残缺、失真的技术壁垒，释放海量文档数据价值，打造智能化应用的数据底座。通过深入布局"AI+"垂直行业，融合大模型、数

2026-06-18 18:09:53 | 23 阅读

市政部门逆袭：里约 IT 公司开源模型硬刚 GPT-5.5

今日凌晨，AI 界被一张 HuggingFace 的模型截图彻底引爆。主角并非 OpenAI 或谷歌的新作，而是一行令人大跌眼镜的开发者署名："Prefeitura do Rio de Janeiro"——即里约热内卢市政府。绝非误读。这家肩负巴西城市 IT 基建重任的市政企业，在未做任何预热、未发一篇论文、未开一场发布会的前提下，径直在 HuggingFace 上线了一款参数量达 3970 亿的开源大模型，随即——它竟将一众硅谷巨头的作品甩在身后。该企业名为 IplanRIO，全称为"里约热内卢市政信息

2026-06-15 16:26:36 | 22 阅读

OpenAI赋能生命科学，推出独立模型线

大家好，我是深耕AI领域的老章OpenAI 近日重磅发布新功能，瞄准药企、实验室及公共卫生领域——GPT-Rosalind 功能迭代该模型线独立于ChatGPT与Sora，专门针对生命科学研究，以DNA双螺旋发现者Rosalind Franklin命名小黑总结了此次更新的核心：生命科学不能仅靠会答题的大模型，必须整合模型、工具、数据及可复查成果继续阅读先梳理一下发展脉络：定位清晰：仅面向合格组织的科研工作台，与面向大众的通用ChatGPT截然不同具体功能包括：听起来就像在对话框里安插了一位全职博士后简而言

2026-06-15 01:25:25 | 10 阅读

告别智商税！2026 AI玩具深度横评，奇多多实力出圈

“妈妈，快看这幅画，这是三只眼的绿色怪兽，它是不是比超人还要厉害？”“妈妈，乐高小人晚上会自己坐火箭去火星吗？”每个工作日下午，拖着疲惫的身心挤完地铁刚进家门，5岁的儿子就会像小炮弹一样冲向我。身为每天在公司连轴转、回家还要处理代际教育矛盾的职业女性，我常在崩溃边缘挣扎：老人只能投喂电视，自己想陪却精力耗尽。看着满屏的“智能AI玩具”广告，很难不让人心动。但动辄上千元的AI玩具，究竟值不值得入手？这会不会只是披着智能外衣的“智商税”？买回来会不会变成“三天新鲜，随后吃灰”的碎钞机？为了帮大家看清真相，我自

2026-06-14 16:53:29 | 16 阅读

AI学习圈丨Agent期末大考，榜首仅拿23分？

近期，UC Berkeley团队发布的ALE（Agents' Last Exam，即智能体最终测试）基准测试正式上线。这项测试专注于评估AI智能体在真实职场环境下的执行上限，汇总了来自100多个机构、300多位专家的1500多道实战题目，全方位涵盖了55个职业细分领域。在备受瞩目的总榜中，搭载ALE Claw框架的GPT-5.5凭借23.0%的通过率拔得头筹，紧随其后的是搭载Claude Code的Claude Opus 4.7，通过率为22.7%。此前在多轮测试中表现亮眼的Fable 5搭配Cl

2026-06-14 12:07:51 | 7 阅读

智能英语在线测评系统的设计与实现

构建一套智能英语在线测评系统，不仅能够显著削减人工命题、监考与批改的费用支出，更能借助人工智能技术达成传统测评难以实现的“因人而异”自适应考核以及全面的听说读写技能自动化精准评估。以下为该系统的整体架构规划、核心AI技术实现路径以及具体开发方案：一套完善的智能英语在线测评系统应涵盖以下五大关键模块：知识网络搭建：依照词汇层级（如中学水平、四六级、雅思标准）、语法体系（如从句结构、时态变化）、能力层次（隐含语义解析、细节捕捉）进行语料资源的标签化管理。自适应测评（CAT）：采用项目反应理论（IRT，Item

2026-06-13 12:29:49 | 20 阅读

2026 年花 6999 元买华为 Mate70 Pro：真 AI 体验深度揭秘

AI PHONE REPORT · 2026华为 Mate70 Pro 深度评测 ·一组测试数据令我颇感意外：在为期两周的日常体验中，华为 Mate70 Pro 的 AI 功能日均触发次数超过 40 次——无论是录音自动提炼摘要、拍照即时 AI 增强，还是发消息时的后台翻译待命，乃至通话中的实时降噪……这一数据意味着什么？它表明华为所谓的「真 AI」并非 PPT 上的功能罗列，而是切实融入了你的日常使用场景之中。然而问题在于——在手机行业，「AI 手机」的概念已被过度消费。小米自称 AI 手机，OPPO

2026-06-13 01:16:11 | 21 阅读

影石 Luna Ultra 深度评测：夜景表现惊艳

原以为手持云台相机的竞争已至天花板，直至体验了 Luna Ultra 的夜拍效果。配备 1 英寸大底主摄、双摄变焦系统、Log 模式及 120fps 慢动作……其成像质感早已超越传统手持云台范畴。这款本应侧重“趣味”的设备，如今却在专业影像领域大展身手。 “掌”握科技鲜闻（微信搜索 techsina 或扫描左侧二维码关注）新浪科技新浪科技为你带来最新鲜的科技资讯苹果汇苹果汇为你带来最新鲜的苹果产品新闻新浪众测新酷产品第一时间免费试玩新浪探索提供最新的科学家新闻，精彩的震撼图片新浪科技意

2026-06-12 02:42:14 | 20 阅读

AI教育新纪元：标准引领，方案落地|蓝桥青少发布会即将开启

人工智能教育，已不再是探讨“做不做”的议题。过去一年，从大模型到智能体，从AI工具到AI课程，人工智能正迅速融入教育一线。家长在问：孩子如何真正理解AI？机构在问：AI课程怎样系统落地？教师也在问：面对技术变革，课堂、评价与教学方法该如何升级？热潮之后，行业真正的需求究竟是什么？6月15日至24日，蓝桥青少将依次亮相成都、南京、北京、深圳四座城市，举办“AI教育：从标准到方案”蓝桥青少人工智能(AI)教育评测与教学体系发布会。本次发布会将聚焦“孩子学什么、机构怎么教、教师如何成长、学习成果如何评价与反馈”

2026-06-11 19:20:40 | 44 阅读

AI 数小时将补丁变武器，谷歌发布扩散模型 | 6 月 11 日 AI 早报

2026 年 6 月 11 日 · 专为技术人打造的 AI 行业快讯从昨夜至今晨，最引人注目的并非又一款登顶榜单的模型，而是一项令所有安全团队脊背发凉的研究：补丁刚刚发布，AI 仅需一个下午便能将其逆向为可用武器。此外，谷歌一口气推出了扩散式语言模型及可运行于笔记本的 Gemma 4，OpenAI 的上市计划再次推迟。八条资讯，精选重点。Anthropic 发布了一项令人坐立难安的研究，直指安全圈熟知的"N-Day"难题——补丁一旦发布，新旧代码的差异便直接暴露了漏洞位置。研究团队以 Fi

2026-06-11 10:30:58 | 16 阅读

AI技术赋能国通语教学克什克腾旗学校打造智慧课堂新范式

新学期伊始，赤峰市克什克腾旗经棚实验中学的课堂上出现了新变化。学生们手持智能语音答题设备朗诵古诗《望庐山瀑布》，话音刚落，电子屏幕即刻呈现得分情况与发音问题，语文教师苏都依据实时学情数据即时指导，帮助学生纠正读音偏差。"我们引入AI听说课堂系统作为智能教学帮手，这套系统运用与普通话水平测试相同的评测技术，既能给出规范的国通语范读，又能协助教师灵活调控教学进度，提升学生研习国通语的积极性。"苏都老师介绍道。信息技术走进校园，为传统教学模式升级提供有力支撑。近年来，克什克腾旗经棚实验中学引入AI听说课堂系统，

2026-06-10 18:49:38 | 28 阅读

重磅发布 | 2026 人工智能终端四级标准详解：定义、等级与产业影响

近期，工信部联手商务部、市场监管总局等机构，共同颁布并推行《人工智能终端智能化分级》（GB/Z 177—2026）这一系列国家规范。该标准体系构建于“2+N”框架之上。其中“2”指代两项基础通用规范，分别为《第 1 部分：参考框架》及《第 2 部分：总体要求》，旨在界定人工智能终端概念、确立分级准则与测试手段，归纳出感知、认知、执行、记忆、学习五大核心智能要素，并设定 L1 响应级、L2 工具级、L3 辅助级、L4 协同级四个层级，智能程度逐级递进，L4 协同级未来将随产业演进持续优化。“N”代表面向各类

2026-06-09 18:31:59 | 8 阅读

万名AI虚拟患者上线：硅碳对决，全科诊疗挑战赛启动

考试满分的AI，能否应对现实中错综复杂的病患？此次，我们让“硅基智能”与“碳基医学生”同场竞技——评判标准回归医疗本源大模型正推动医疗AI从“医学百科”迈向“临床决策中枢”。然而，一个核心问题始终悬而未决：那些在MedQA、USMLE等考试中斩获高分的AI，真能走进诊室，应对那些“隐瞒病情、言语矛盾、身患多种基础病”的真实患者吗？传统评测将鲜活的临床难题压缩为选择题，掩盖了医患沟通的博弈、复杂共病的陷阱，更缺乏对“问诊—检查—诊断治疗”全链条能力的系统考核。这一次，我们拒绝单选题。由魔搭社区、浙江大学、浙

2026-06-09 13:57:13 | 38 阅读

AI 挑战高考：分数咬紧，短板仍存

AI 也去参加了高考？今年高考结束后，公众号「数字生命卡兹克」组织了 12 款主流 AI 共同应试语文与数学，并邀请教师进行盲评。最终，MiMo 以 256.3 分位居榜首，Kimi 以 256.29 分紧随其后，两者分差仅为 0.01 分。从单科成绩来看，GLM 与 Gemini 在语文科目中并列第一，而 DeepSeek、MiMo 及 ERNIE 则在数学科目中共同夺魁。这一结果既展示了 AI 的强大实力，也揭示了其明显的局限性。在数学方面，AI 善于审题、拆解条件及推导步骤；而在语文方面，特别是作文

2026-06-09 06:15:35 | 19 阅读

AI前哨周报：资本与品控成新焦点，模型参数时代退潮

资本权力重组 (Google-BH交易) 🌍 Google向Berkshire Hathaway发行股票，科技公司开始用股权换顶级资本背书而非现金 🇨🇳 国内VC圈将其当"八卦财经"处理，未识别出"AI时代资本结构重组"的战略含义 💡 中国GP缺乏"巴菲特型"资金背书，退出定价权受制于人；国家队资金密集入局是对应动作AI Infra新物种爆发 (Railway/Daytona) 🌍 Railway月增74%、$200K+月消费客户，3M用户；Daytona

2026-06-08 12:39:29 | 29 阅读