哈佛研究称AI急诊分诊能力超越医生 前瞻性临床试验呼声高涨
哈佛大学主导的一项研究发现,微软旗下OpenAI研发的"o1"模型在急诊分诊场景下的诊断精准度媲美甚至超越人类医生,该成果促使业界呼吁启动前瞻性临床验证。
AI实战:用反问砍掉5步落地,避免PM被过度设计忽悠
「PM与AI协作实战」第13章:常被忽视的第三大风险——AI给出的往往是“看起来很美却多余”的过度方案。基于亲身经历,总结了5个反模式和3条防御准则,助你识别那些看似完美实则无用的AI建议。目前关于AI协作的讨论,大多集中在两方面:方向一:教你如何驾驭AI。包括提示词编写、工具选择及工作流搭建。方向二:警示AI的错误风险。诸如幻觉、记忆缺失及数据造假等问题。这两个方向都很有价值。然而,还隐藏着一个更为隐蔽的风险——AI提供的方案,极有可能是“看似合理实则多余”的过度设计。其每一步逻辑都自洽,数据来源清晰,
AI代理也要身份认证:Experian携手Visa、Cloudflare打造数字信任体系
AI代购服务,正面临一个无法回避的实际挑战。以往在电商平台点击“购买”,其背后通常对应着真实的用户、账户、支付卡片以及风控数据。但当AI智能体接管搜索、比价和下单流程后,商家接收到的可能仅仅是自动化程序产生的数据流。这究竟是获得授权的私人助手,还是乔装打扮的恶意机器人?它是否具备支付权限?一旦出现问题该由谁承担责任?此次Experian并未选择打造新的购物代理,而是致力于为“替你消费的AI”构建身份识别与责任追溯的基础架构。更直接地讲,他们希望将KYC理念延伸至AI代理时代,演变为“了解你的代理”。据Ex
AI 编程:从生成到验证,工程闭环的关键挑战
InfoAI 编程首先降低了编写代码的门槛。然而,这迅速引出了一个新的难题:当代码生成得又快又多时,谁来确保这些实现是符合预期的?许多团队最早遇到的并非代码生成环节的问题,而是在代码审查(Review)阶段。AI 能快速生成大段代码,但如果每一次都需要研发人员逐行审阅、判断其质量和可合并性,这种体验会相当不轻松,甚至违背直觉。这意味着,AI 编程的第一阶段是实现代码的生成和采纳。而其第二阶段,则是确保生成结果的可验证性、可修正性,并最终融入稳定的工程流程。许多团队在应用 AI 编程时,会首先从代码审查、差
AI 来了,原则系统终于不再停留在想象
最近一段时间,我在做一套东西:原则系统。如果放在以前,这个说法听起来确实有点“虚”。过去我读了不少书,也会觉得自己似乎该整理一套属于人生的准则。看到一些特别厉害的人把自己的判断方式总结出来,我也会想去学着做。但对普通人来说,以前的原则系统很容易就卡在想象层面。因为很难一直记录:当时我是怎么做出判断的。也很难在每次面对选择时,把以前的经验再调出来用。更麻烦的是,一旦某次判断错了,你往往也很难认真回看:到底是推理出了偏差,还是这条原则本身就站不住。所以很多时候,所谓原则最后会变成几句“听着很对”的话。比如长期
陶哲轩:只会做题终将落后,AI推动数学进入“证明过剩”
《自然》杂志近日就人工智能如何改变数学家展开了采访,受访者是菲尔茨奖得主陶哲轩。他认为,AI会迫使我们重新审视一些最基础的概念——什么才算数学证明?论文究竟意味着什么?数学家这个职业追求的目标到底是什么?如果这些问题不由人主动提出,最终答案可能由AI公司给出,或更直接地被经济利益所左右。那为何数学会成为AI眼中的“下一大目标”?在其他领域的应用里,AI最大的硬伤往往在于它可能产生难以核验的错误。但在数学中,情况几乎完全不同:你能把结果自动核对——至少当输出被当作定理的证明时是如此(当然,这并不等于数学家工
AI能否真正替代我?
年初OpenClaw发布之际,我体验后的直观感受是:AI足以胜任我的岗位。令人意外的是,我起初并未感到担忧,反而生出一种难以名状的激动。随后的两个多月里,我持续观察并亲身实践,认真验证这一想法。我的实践过程我从事软件测试工作。为了验证AI的替代可能性,我选择了一项最具挑战性的任务:利用AI自动解析测试覆盖率报告,并直接产出自动化测试用例。设想很美好,执行却处处受阻。第一步便在覆盖率分析上遭遇瓶颈。我将报告交付AI处理,它按文件覆盖率低至高的顺序排出了优先级——表面看似合理,实则缺乏业务理解。部分文件覆盖率
AI的虚假信息陷阱
🌻点击关注,有惊喜送给你~❤️🙃早先曾听闻AI会信口开河,这回总算亲身体验了何为AI的凭空捏造由于友人假期计划前往马尔代夫昨日午后才记起未兑换美金(需备些美元作小费之用,仅兑换百元即可)时间紧迫遂托我协助前往银行兑换赶在四点半前奔赴了农业银行与工商银行农业银行的外汇已售罄(兑换外币均需提前预订)抵达工商银行时却发现已结束营业原以为农行四点半关门已算早未料到工行竟四点便停止服务因银行告知只能假期后再预约换汇无奈之下向豆包询问假期苏州何处仍可兑换随后获得了如下答复今后切不可盲目相信AI所言。纯属杜撰,却说得煞
AI热点追踪:2026年4月30日,四大巨头7000亿支出交卷,AI投入步入验证期
【每日速览】谷歌、微软、亚马逊及Meta等科技巨擘于4月29日盘后同步发布第一季度业绩,2026年四家公司在人工智能领域的资本开支预期总额已逼近7000亿美元。OpenAI遭遇业绩滑铁卢:周活用户未达10亿大关,一季度营收缺口高达22亿美元,首席财务官发出警告称无力继续采购算力,相关概念股因此全线下跌。马斯克起诉OpenAI案进入庭审次日,马斯克出庭作证表示,人工智能既可能推动人类繁荣,也可能招致毁灭。腾讯混元最新模型Hy3预览版登顶OpenRouter全球调用量榜首,在工具调用及编程场景表现优异。商汤科
攻克三项关键技术,让低空飞行更稳更安全
4月28日,山东烟台栖霞通用机场迎来重要里程碑:一架通体白色的小型飞机在38分钟内依次完成“起飞爬升—巡航飞行—下滑降落”三个阶段,随后平稳着陆。这标志着国内首款严格依据中国民航适航审定规章及流程、实现全程正向自主研发制造的载人自转旋翼机顺利首飞。 “整机姿态平稳、操控精准,动力、旋翼、航电与飞控系统工作状态稳定,各项性能指标均达到设计目标并满足适航审定预期。”该自转旋翼机研发者、翼凯来(烟台)航空装备有限公司董事长张竞元向科技日报记者表示:“本次首飞成功,意味着我国在机身共固化一体成型、全碳纤维承载式机
联想并购Phoenix固件业务,夯实AI底层技术底座
新浪科技讯 4月29日晚间消息,联想集团宣布,已顺利完成对Phoenix Technologie公司固件技术业务的收购,并同步取得相关知识产权、技术资产以及核心研发团队。交易落地后,联想将固件研发能力进一步内化,为 AIPC、AI 服务器及端侧智能设备打造自主可控的技术支撑底座。 据了解,Phoenix Technologie是PC产业链内的老牌技术厂商,在固件领域积累了较长发展历史,其技术方案长期服务于全球主流PC品牌。在联想 ThinkPad 系列上,该公司长期提供 BIOS 解决方案,具备成熟的工程
人力智能:Pi网络赋能AI新纪元
人工智能正在不断发展,但构建可靠系统最具挑战性的部分仍在于深度理解人类需求。对于致力于优化模型、提升推理质量或扩展数据标注与评估的企业而言,人力投入仍是不可或缺的要素。打造强大的人工智能模型远不止是计算能力的问题:人工智能需要人类参与循环改进输出,定义质量标准,验证正确性,解决歧义,并确保系统真正造福人类社会。非人类强化学习和自动化训练方法在特定或定义明确的环境中能发挥巨大作用,有助于规模优化和效率提升。但它们在重要方面仍存在局限:它们往往优化的是代理而非真实的人类偏好,可能容易受到奖励黑客的攻击,并且难
AI选题:三步抓住高频方向
三步流程用AI做选题:第一步 定好方向:把你的行业领域和目标人群说明给AI,让它先吐出10个高频痛点词组(例如“新手学Python卡在哪”)。第二步 扩展选题:从中选出3个关键词,要求AI用“问题+解决方案”的结构来生成,每个词再落到5个更具体的选题(如“月薪3千如何用AI做副业”)。第三步 精准筛选:让AI扮演平台算法,基于“点击率+稀缺性”对选题进行评分,最终留下前3个并直接开始试写。实操小建议:每轮生成完成后,再追问“换成反常识视角再出5个”,从而避免内容同质化。
AI开始代你花钱
Google在4月28日表示,公司将AP2(AgentPaymentProtocol)捐赠给FIDO Alliance(Fast Identity Online),用于推动安全代理支付的未来发展。推动路径从“做产品”迈向“定生态标准”,而所谓“Google规则”也正在逐步变成行业通用做法。Google的AP2由谷歌联合Coinbase、Mastercard等头部力量于2025年9月发布,是一项开放标准协议(Agent Payments Protocol)。它的目标,是让AI代理与商家之间建立可信的金融交易
AI 正在重塑软件开发分层
过去一年,程序员圈子里有个变化越来越清晰:一部分人把 AI 当作更快的“写代码助手”,负责补全片段、改写样板、修复缺陷、搭建脚手架;另一部分人则更关注如何把 AI 视为一种需要被管理的执行能力,重点在于它怎样接收任务、怎样调用工具、怎样保留上下文、怎样核验结果,以及在失败之后如何回到正确路径。从表面看,这两类人都在“用 AI 做开发”。但从行业演进的角度去看,他们其实站在不同层级。前者带来的是局部效率的提升,后者触及的则是软件生产方式的重构。真正拉开差距的,已经不只是“会不会去问模型”,而是能否把模型嵌入