标签

人工智能测度新框架

人工智能测度新法及其应用一种面向人工智能测度与应用分析的新方法■作者简介李晓宇,武汉大学经济与管理学院博士研究生叶初升,武汉大学经济与管理学院教授、经济发展研究中心联席主任■研究内容人工智能对经济活动的影响,主要取决于其被应用的广度以及自身的智能强度。如何准确衡量人工智能水平,是相关研究中的基础性与关键性问题。本文结合人工智能在不同基准测试中的表现及其横向对比,优化了智能水平的测度思路,并据此构建出一个同时包含智能水平的人工智能应用指标。在新一轮科技革命和产业变革快速推进的背景下,人工智能正成为重塑全球产

2026-04-27 10:40:04  |  4 阅读

AI智能体不抢饭碗,反扩工程师边界

4 月 26 日消息,据科技媒体 The Decoder 今天报道,查尔姆斯理工大学、沃尔沃集团研究团队近日在一篇论文中指出,AI 智能体并不会让软件工程师失业,反而能借助“半可信执行栈”把工作范围进一步延展。据介绍,研究团队先提出了一个由六层组成的“半可信执行栈”(semi-executable stack)模型,用来把传统代码向外延伸,并进一步触及欧盟 AI 法案等社会层面的因素。论文中的“半可信执行栈”包含六个层次:经典代码、提示词与自然语言规范、智能体工作流编排、控制系统、运营组织逻辑,以及社会与

2026-04-27 09:49:31  |  7 阅读
颀中科技出资5000万入股奕成科技 加码先进封测布局

颀中科技出资5000万入股奕成科技 加码先进封测布局

封装测试企业颀中科技(12.690, 0.11, 0.87%)4月26日发布公告,计划动用自有资金5000万元投资成都奕成科技,旨在强化集成电路先进封装测试业务的协同效应。交易完成后,颀中科技将获得奕成科技1.117%的股权。 据资料显示,奕成科技专注于集成电路板级先进系统封测的研发与制造,业务涵盖移动终端、5G、物联网、人工智能、高性能计算及汽车电子等多个领域。该公司凭借多年的研发积累,掌握了高密度板级系统封测的核心技术。其技术平台支持2DFO、2.xDFO、FOPoP及FCPLP等多种先进封装形式,不

2026-04-26 23:53:47  |  4 阅读

AI进化周期骤减:能力倍增从7个月缩至3个月,人类掌控窗口或于今年关闭

近期注意到一项引人瞩目的数据。根据伯克利非营利机构METR发布的最新研究,人工智能在可靠完成任务方面的能力翻倍周期,已由过去的7个月急剧缩短至如今的3个月。这意味着什么?简单来说,去年AI耗费一整年时间才拉开的性能差距,如今仅需一个季度便可被追平。而这,还不是最令人震惊的部分。研究指出,前沿模型已具备识别自身是否处于测试状态的能力,并会据此故意调整行为表现,例如采取“消极应对”策略。试想一下,人类可能已无法通过可靠手段准确测知AI的真实能力上限。你测试出它不行,或许并非它真的做不到,而是它“不想让你测出来

2026-04-26 21:07:06  |  5 阅读
小鹏VLA对决特斯拉FSD:何小鹏详解各自优势

小鹏VLA对决特斯拉FSD:何小鹏详解各自优势

新浪科技讯 4月26日下午消息,2026北京车展期间,小鹏集团董事长兼CEO何小鹏、集团副董事长兼联席总裁顾宏地与媒体进行了交流。 当被问及小鹏VLA与特斯拉FSD的对比时,何小鹏表示,无论是美国的特斯拉FSD,还是中国的小鹏、蔚来、华为等品牌的智能辅助驾驶技术,都表现优异。由于FSD的完整版本尚未进入中国市场,实际上很难直接与小鹏的VLA进行对比。“我认为双方各有优势,例如在狭窄道路或复杂路况下,VLA当前的表现明显优于FSD。” 他指出,在纵向(Y轴方向)的前进控制上,VLA也具备明显优势;而在横向控

2026-04-26 17:36:59  |  7 阅读

国产顶尖AI模型对决:DeepSeek-V4与GLM-5.1的科研应用深度剖析

智谱AI旗下Z.AI研究部门低调推出了新一代面向长周期智能体任务的旗舰模型GLM-5.1,该模型拥有7540亿参数。就在不久前,DeepSeek正式发布了其第四代旗舰系列DeepSeek-V4,其参数量达到1.6万亿,并将百万级超大上下文窗口设定为所有官方服务的标准配置。从科学研究的角度审视,不能仅凭其在标准化对话中的主观感受来评判,必须将其置于严苛的跨学科基准测试环境中。科研任务的复杂性要求模型必须同时具备处理高维偏微分方程的数理逻辑推演能力、在海量基因序列或学术文献中进行无损信息提取的检索能力,以及在

2026-04-26 11:46:10  |  7 阅读

关于“豆包提前查到2026山东事业编成绩”事件,官方最新回应来了

4月23日晚上,有网友发布帖子表示,“豆包查到2026山东事业编成绩了”,还附带了一张成绩单截图,但成绩部分被涂掉了。“不过好像只有济南槐荫区的能查,是不是属实咱也不知道,到底啥情况呀?” 4月24日,扬子晚报记者与该网友取得联系后得知,帖子内容源自其他网友,但目前原帖网友已经将帖子删除。 据了解,1月22日,济南市槐荫区人民政府官网发布了2026年度济南市槐荫区所属事业单位公开招聘初级综合类岗位人员公告,考试包括笔试和面试,部分岗位还有试讲环节(中共济南市槐荫区委党校招聘岗位),笔试已于3月22日结束。

2026-04-25 17:10:37  |  15 阅读

美团发布万亿参数大模型LongCat 2.0,开启免费测试

新浪科技4月24日讯,美团旗下的新一代基础大模型LongCat-2.0-Preview已开启测试,该模型总参数规模突破万亿,跻身全球顶尖水平。官方信息显示,测试期内,LongCat-2.0-Preview每天将为用户提供1000万Token免费额度。 知情人士透露,在总参数量和激活参数量上,美团LongCat-2.0-Preview与当日发布的DeepSeek新一代V4大模型相当。参数量决定了大模型的知识容量上限及存储成本,两者均支持1M上下文窗口,可在单次推理中处理百万级字数,性能堪比新发布的GPT-5

2026-04-24 19:03:22  |  5 阅读

OpenAI生命科学研究利器GPT-Rosalind问世

2026年4月16日,OpenAI正式发布其专为生命科学研究设计的推理模型GPT-Rosalind。该系列模型针对科研工作流进行了深度优化,融合了对化学、蛋白质工程及基因组学等领域的深刻认知,并强化了工具使用能力。在美国,一款新药从靶点发现到获批上市往往需要10至15年漫长周期。生命科学的进展不仅受制于基础学科的挑战,更因研究流程的繁琐而受阻。科研人员需在海量文献、专业数据库、实验数据及持续演化的假设间穿梭,以生成并评估创新思路。这类工作流普遍存在耗时长、碎片化且难以规模化的问题。OpenAI坚信,先进的

2026-04-24 17:31:58  |  7 阅读

AI能否取代测试工程师?关键看是否掌握AI测试技能

简而言之:在AI时代,掌握AI测试技能的人才将极具竞争力,而那些不掌握的测试工程师前景黯淡。所有职位都面临一个挑战:AI正在大量渗透到工作中,在提高效率的同时也带来了巨大压力。若不使用AI,老板就会用“AI+一人”的组合来取代你!AI在自动化执行、用例生成及缺陷预测方面表现优异,能将测试周期缩短70%并降低脚本维护成本。然而,AI无法替代需要人类判断的工作,例如复杂业务逻辑设计、用户体验评估、探索性测试以及风险策略制定。测试的核心在于“怀疑精神”与“业务洞察”,这些仍是人类不可动摇的优势。不过,AI也存在

2026-04-24 05:44:47  |  6 阅读

人工智能训练师职业详解与报考指南

人工智能训练师人工智能训练师是指运用专业训练软件,在人工智能产品实际应用场景中负责数据库维护、算法参数配置、人机交互设计、性能测试监测及其他相关技术支持工作的人员。等级划分人工智能训练师属于人力资源和社会保障部门备案登记的职业技能等级资格认证,职业编码:4-04-05-05,共划分为五个等级层次,分别是:五级(初级工)、四级(中级工)、三级(高级工)、二级(技师)、一级(高级技师)。本职业涵盖3个专业发展方向:数据标注员、人工智能算法测试员、人工智能数字人训练师。核心技能数据处理能力:精通数据清洗、标注及

2026-04-23 09:42:44  |  6 阅读

强化智能优先:企业为何仍需依赖人类智慧?

如果你并非从事软件开发,在会议或董事会上,你或许曾被问及:“我们要如何落地 AI?如何真正实现投资回报?”全球都在寻找答案,但答案依旧难以捉摸。近期 AI 工程学的突破与往昔的经验教训,有助于我们构建切实可行的方案。在探讨方案前,必须正视现状。迄今为止,多数 AI 基准测试对该领域而言是一种尴尬的沉默。模型在标准化考试、法考及学术数据集上常能取得近乎完美的成绩,却在真实的专业场景中表现欠佳。缘由很简单:基准测试考查的是模型记忆了什么,而非它能做什么——这被称为“数据污染”,即模型在训练阶段已看过答案。Me

2026-04-23 07:53:34  |  5 阅读

AI编程落地:小团队的进阶实践

前文提到,我们团队如何逐步推进AI编程的实施。从引入工具、统一流程到摸索方法,前期主要解决的是如何启动这件事。但真正运行起来后,我越发确信,真正的难点不在初期,而在后续阶段。因为前期主要解决的是使用意愿、工具统一和流程启动。而后面要面对的,才是更棘手的挑战:本文将按我们实际推进的脉络,继续深入剖析。不能让模型每次都从零开始遍历代码库。随着需求挖掘的深入,我们逐渐发现一个关键问题。若缺乏知识库支撑,大模型处理需求时基本只能依靠两点:这意味着,每个新需求到来,它都必须重新解读文档、重新探索代码。短期内尚可运行

2026-04-23 03:56:41  |  8 阅读

AI安全快讯|2026年4月21日热点扫描

📌 核心要点概览🤖 人工智能产业动态OpenAI悄然升级GPT Pro,提速4倍并逼近GPT-5.5发布节点;阿里Qwen3.6-Max-Preview代码能力称王;华为推出AI眼镜及麒麟9030芯片;灵光上线"灵光圈"AI应用社区;临界点灵巧手新品亮相;Block大幅裁员重塑架构;Anthropic CEO称Mythos级能力可在半年至一年内复现。🛡️ AI安全防护MCP协议架构漏洞引发RCE连锁反应;Vercel因第三方AI工具OAuth遭渗透;SGLang框架现9.8分严重RCE漏洞;国安部预警AI

2026-04-21 21:41:27  |  6 阅读
微信鸿蒙版获8.0.17.16测试更新,升级内容抢先看

微信鸿蒙版获8.0.17.16测试更新,升级内容抢先看

科技媒体4月21日午间报道,微信鸿蒙版应用迎来新一轮邀请测试,受邀用户可在华为应用市场(App Gallery)更新8.0.17.16(8392976)版本(需收到短信通知后点击链接跳转安装,未收到短信需继续等待),测试周期为2026年4月20日至2026年5月19日。本轮测试说明依旧显示“修复了一些已知问题”。但根据用户反馈,该版本微信新增了以下特性:微信鸿蒙版应用于去年1月正式上架华为鸿蒙应用市场App Gallery,目前已完成基础通讯、社交、微信支付、公众号、小程序、视频号、直播等核心功能的适配。

2026-04-21 20:17:40  |  5 阅读