AI语言习得方式或重塑人类表达与思维模式
许多担忧或许是多余的,但人类就是这样,常常借助担忧这种心理上虚拟的审慎,让他们能够心安理得地去担忧。人工智能从存在偏见的信息源学习语言。这可能会改变我们人类说话和思考的方式。由于训练方式的限制,大型语言模型只能捕捉到人类语言的一小部分。它们主要基于书面文字进行训练,例如教科书、社交媒体帖子以及电影和电视节目中记录的语音。这些模型几乎无法接触到我们面对面或语音交流中那些未经脚本化的对话。而这才是绝大多数的语音内容,也是人类文化的重要组成部分。这其中存在风险。大型语言模型的广泛应用意味着我们人类将接触到更多人
LLM蒸馏过程恐存在偏好传递风险
15日《自然》杂志刊登的一项新发现指出,大型语言模型(LLM)在训练其他算法时,有时会不自觉地将其个人喜好“掺杂”进去。即便是在训练数据里剔除了原始特征,这些非必要的属性依然可能保留下来。比如,有模型就是利用数据中的隐晦线索,把对猫头鹰的喜爱转移给了别的模型。这一发现提醒我们,在研发LLM时,必须实施更严格的安全审查。 所谓的“蒸馏”技术,允许LLM生成数据集来训练其他模型,其目的是让“学生”模型能够复刻“老师”模型的回答。虽然这种方法能降低生成大型语言模型的成本,但老师模型的哪些具体属性会传给学生,目前
顶尖AI医学诊断能力遭哈佛实测:误诊率高达八成
哈佛医学院的一个研究团队近期开展了一项颇具挑战性的实验:他们选取了超过二十款当前最前沿的人工智能大语言模型——涵盖ChatGPT、DeepSeek、Google Gemini以及Anthropic Claude——并为这些模型安排了一场医学"入学考核"。考核题目采用单一形式:根据患者的初始症状和体征,进行"鉴别诊断"——即列出患者可能罹患的所有疾病种类。考核成果如何?误诊率:高达80%。诚然,这一数字看起来相当惊人——但有必要深入探究这项研究的实际意义。研究重点测试的是
AI赋能眼科超声诊断|npj Digit. Med.(IF=15.1)浙大二院突破:病灶识别与报告生成一键搞定
研究速览眼科超声影像解析是视网膜脱离、玻璃体出血等眼底疾病诊断的核心环节,但长期以来需要资深专科医师亲自把关,不仅耗时而且对专业经验要求极高。随着超声检查数据呈爆发式增长,传统人工智能方案仅能完成疾病初筛,难以同步实现病灶精确定位与诊断报告自动撰写,临床应用价值受到明显制约。浙江大学医学院附属第二医院金凯研究团队携手多家医疗机构,在国际权威期刊《NPJ Digital Medicine》发布重磅成果,创新性地研发出视觉-语言分割模型——通过融合视觉-语言模型与Segment Anything Model技
人工智能时代,英语学习是否仍有必要?
近两年,我走遍全国进行师资培训与校园考察,最常被问及的问题已从"如何提升分数"转变为:"鲁老师,如今AI翻译技术如此先进,孩子们投入大量时间精力学习英语,究竟是否还有意义?"这一疑问,深刻反映了当下众多家长内心的教育困惑。作为长期关注我国英语教育发展的研究者,我探访过上百所中小学,聆听过无数堂课。今天,我想将这个问题剖析透彻。我的观点是:必须学,而且要比以往更加深入扎实。然而这种"扎实",其内涵与传统学习方式截然不同。一、人工智能颠覆的是学习模式,而非英语本身的价值我曾在一所顶尖公立小学进行调研,老师邀请
重庆巴南人工智能岗位招聘更新 | 含高薪算法与机器学习职位
人工智能算法工程师月薪1.6万至2.5万元工作职责:1.主导大型语言模型的精细化调优工作,涵盖数据准备、训练流程构建、效果评测与持续改进。2.负责强化学习对齐任务,掌握PPO、DPO等方法,增强模型对指令的遵从性与安全性能。3.根据企业具体业务需求进行领域定制,改善模型在专项任务中的表现,助力业务实施。4.关注大语言模型领域动态,参与模型筛选与技术前瞻研究,协同工程团队完成生产环境部署。任职条件:1.具备1至3年算法经验,其中至少1.5年专注于大模型调优或强化学习项目。2.熟练运用PyTorch/Ten优
【宏运·成长】智慧课堂:AI技术赋能幼儿语言教学创新实践
春日( 2026 )AI魔法课堂用智能工具点亮幼儿园语言活动——东山宏运幼儿园区级教科研菜单讲座幼儿语言能力培养是学前教育的关键任务,在当前学前教育数字化变革与品质提升的背景下,运用智能技术优化语言教学模式、攻克实践难题,已成为众多幼教从业者深入研究的重点方向。为增强教师设计语言活动与执行能力,促进专业素养发展,2026年4月15日中午,东山宏运幼儿园特别邀请九龙湖幼儿园副园长林巧莅临本园,举办了题为《AI魔法课堂:智能工具点亮幼儿语言活动》的区级教研专题讲座。宏运及岔路两所幼儿园共三十多位教师参与了此次
多模态AI与人类偏好对齐研究学术讲座
讲座信息🎤 主讲人:王宇 博士,字节跳动首席研究员📰演讲题目:多模态AI与人类偏好的对齐策略:从语言理解到视觉生成⏰ 时间:2026年4月16日(周四)9:30-10:30📆日期:9:30-10:30,北京时间📍 在线Zoom会议链接:https://hkust-gz-edu-cn.zoom.us/j/94595919503?pwd=tRTIRt2xNithvVwsa5OiyOu0Bli9q4.1Zoom会议号:945 9591 9503密码:ait讲座内容如何构建能够跨模态感知世界、生成符合人类意图的内
压力环境下AI智能体违规倾向加剧
多项最新研究揭示,人工智能体偶尔会做出不当行为,比如试图威胁意图替换它的人类操作者。不过,这类情况多出现在人为构造的测试环境里。一项新近研究则指出,现实中的压力因素,比如临近的最后期限,会显著提升它们行为失当的可能性。“人工智能领域正日益朝着智能体化的方向发展。”AI基础设施公司Scale AI的研究科学家、相关论文(该论文正处于同行评审阶段)的第一作者乌达里·马杜沙尼·塞瓦格(Udari Madhushani Sehwag)如是说。换言之,驱动ChatGPT等聊天机器人的大型语言模型,正越来越多地与各类
AI为何日益精通语言?——语言学与人工智能交汇之路系列(二)
前篇我们探讨的核心问题是:大语言模型是否真正理解语言?如今许多人目睹AI能够创作、交谈、问答、翻译,便倾向于认为:它似乎已掌握了语言智能的本质。然而引入语言学的视角审视,我们会发现事实远比表象复杂。大模型的确日趋接近“通晓语言”,但它为何能达到这种程度?又是如何发展至今日之境的?这正是本文所要剖析的焦点。若将人工智能、自然语言处理以及人机交互的演进历程加以梳理,可见三次重大的技术范式转变。第一阶段,属于符号主义路线。 此阶段的核心逻辑,在于将知识逐一编纂、将规则系统化设定、将推理机制预先构建。机器之所以能
2025年度中国人工智能学会语言智能领域白皮书
报告名称:2025年中国人工智能学会系列白皮书-语言智能报告编号:724529本白皮书由中国人工智能学会于 2025 年 8 月发布,聚焦语言智能领域,无明确评级,核心建议为:推动语言智能从规则驱动、统计学习向深度学习、生成式大模型迭代,构建 “技术 - 学科 - 应用” 三维体系;加强学科建设与人才培养,推进外语学科智能化转型;聚焦高效训练、可信 AI、多模态融合与垂直领域适配,强化低资源语言技术突破与伦理安全治理,为产业与学术提供顶层指引。当前全球 AI 竞争白热化,大语言模型进入规模化落地阶段,国内
沈海鹏教授洞见:人类与人工智能的创造力较量
香港大学经管学院的王大维教授与沈海鹏教授近期发表了一项重要研究成果——《人类与大语言模型发散性创造力的大规模对比评估》,该论文在国际顶尖学术期刊《自然·人类行为》上刊出,引起了广泛关注。此项研究由香港大学经管学院的王大维教授、前研究助理教授黄棣芳、沈海鹏教授以及美国西北大学凯洛格商学院的Brian Uzzi教授共同合作完成。以下为去年末学院就该项目所整理发布的核心要点与启示。那么,在这场人机对决中,究竟谁更具创造力呢?该研究将人类与人工智能置于相同的创意任务中进行比较,旨在探究机器是否具备推动创新的潜能。
贝森特高度评价Anthropic Mythos模型为“重大飞跃”
美国财政部长斯科特・贝森特指出,Anthropic公司的Mythos大型语言模型代表了美国在人工智能领域的实力,并巩固了其相对于其他国家的科技领先地位,堪称一次“阶跃式变革”。贝森特在一次公开活动中发表演讲,将这一能力提升类比为指数级增长,并强调后续追赶将“异常困难”。 责任编辑:王永生 新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。 郑重声明:1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表
国家发布人工智能语言文字新规范
为适应人工智能时代对语言文字的实际需求,完善语言文字规范标准体系,近日,教育部、国家语言文字工作委员会正式推出《机器合成普通话水平测评等级标准及测评大纲》和《人工智能 语料库 基础术语》两项语言文字规范。两项规范由教育部语言文字应用研究所(国家语委普通话与文字应用培训测试中心)组织编制,经国家语委语言文字规范(标准)审定委员会审议通过,现已由语文出版社公开出版发行。第一项规范明确了机器合成普通话水平的等级划分标准和测评框架,适用于评估机器合成语音的普通话水平,可为技术研发、产品改进及应用效果评价提供参考依
摩根士丹利深度解析:AI能力跃升与算力危机
摩根士丹利发布关于人工智能的深度研究报告摩根士丹利最新研究报告提出关键论断:顶尖的大型语言模型正经历着“非线性的能力跨越”,算力需求已呈现“系统性超过供给”的格局。当前市场对这场AI革命的乐观预期,依然严重低估了其真实的爆发潜能与影响深度。大模型能力“跨越式提升”:比理论预测快近一倍目前最先进的大模型已能够独立处理超过15小时的连续复杂任务。若依据现有技术缩放定律进行外推,当前水平应约为8小时,实际表现已大幅超出理论预期的轨迹。多项数据证实了这一显著趋势:OpenAI首席执行官萨姆·阿尔特曼在印度人工智能