推理引擎_标签-酷阅新闻

京东健康在WAIC 2026展示全场景医疗AI，携手上海AI实验室制定评测标准

新浪科技讯 7月20日上午消息，7月17日至20日，2026世界人工智能大会（WAIC）于上海举行。京东健康携其前沿医疗AI技术参展，并推出“确定性源于执行”核心理念与JoyAI-MedCode（京医千询）代码化推理的重大更新；同时，京东健康还与上海人工智能实验室合作共建MedBench v5.0行业评测基准，其AI医生“大为”和“京东知医”两款产品也一同亮相展示。在论坛上，京东健康正式宣布京医千询核心推理引擎JoyAI-MedCode v2.0的显著升级，推动医疗AI从传统“自然语言推理”向“代码可验

2026-07-20 14:04:12 | 11 阅读

AI科技速览｜2026年7月1日

锁定科知酱，每日10条速讯读懂AI产业动向。AI正迈入科研领域的"核心生产环节"。7月1日外盘资讯披露，Anthropic正式上线Claude Science AI科研工作台，覆盖科研文献梳理、实验规划、数据处理与团队协作等环节，推动大模型从对话工具升级为科研流程平台。这表明AI for Science已从热门概念转化为落地产品，科研单位与产业实验室将成为大模型下一阶段应用的关键阵地。💬 "AI科研的核心，并非取代科研人员，而是压缩从提出问题到完成验证的周期。" —— 产业观察内容创作工具套件再次迎来迭代

2026-07-01 14:12:22 | 96 阅读

2026.6.29人工智能快讯

📅 2026年6月29日星期一让普通人轻松读懂的AI资讯，每日仅需5分钟，轻松掌握AI新动态让普通人轻松读懂的AI资讯，每日仅需5分钟，轻松掌握AI新动态🤩 AI热点速递尖端模型 · 技术革新AI技术前沿 1️⃣ 小红书对外开放RedKnot推理引擎：KV Cache按注意力头拆分实现长文本提速深度解析：小红书RED AI实验室推出推理提速引擎RedKnot，核心策略是将KV Cache沿着"注意力头"维度进行拆分——多数注意力头具有局部特性（仅聚焦邻近token），无需全部存储。

2026-06-29 22:39:25 | 36 阅读

智能体范式革命：形态跃迁、协议统一与可靠性困局

2026 年并非"AI 能力跃升"，而是智能体的存在范式发生了本质性变革。从"被动应答"到"目标驱动、自主行动"——这一跨越远超命令行向图形界面的演进深度。449亿9700万+20x300+近三年人工智能的叙事脉络历经三次关键转折，而 2026 年的这次变革与前两次有着本质区别回顾近三年，AI 领域的故事线经历了三次重要转向：2023 年：GPT-4 问世，"通用人工智能"成为公众焦点，但实质仍是"性能更强的语言模型"。 20

2026-06-21 20:00:10 | 15 阅读

揭秘AI NAS的七层架构：智能存储设备的核心构造解析

智能存储设备需兼顾三大核心任务：数据保存、人工智能运算以及服务输出。这三大任务的底层技术截然不同，却必须实现完美配合。传统的网络存储仅包含存储与应用两个层级。但智能设备不同——推理引擎依赖硬件加速、大模型要求沙箱隔离、智能体需要工具链支持、应用还需远程连接。能力每扩充一项，架构的抽象层级便随之增加。由此，便诞生了以下七个层级：🔩 L1 · 硬件基础层 (HAL)核心要素：Linux内核 + NPU驱动 + GPU驱动 + 设备树。主要任务：集中管控CPU、GPU、NPU、VPU等异构算力模块，提供规范化的

2026-06-03 09:43:57 | 30 阅读

C++ 开发者进军 AI 的破局之法

老李曾是我的同事，深耕后端开发八载，对 std::move 的掌握无人能及，利用 valgrind 排查内存泄漏更是得心应手。今年团队架构调整，他惊觉自己的岗位被贴上“优化”标签，领导直言：“当下我们需要的是精通 AI 的人才。”他随即投身 Python 与 PyTorch 的学习，苦修两月视频课程，虽能熟练调用 torch.nn.Linear，便满怀信心地步入面试考场。岂料面试官仅问一句：“若我们要自研推理引擎，如何实现数据的零拷贝传输？”老李顿时语塞。他忽视了一个关键点：AI 企业需要的并非“只会调用

2026-05-17 19:25:57 | 10 阅读

AI时代C++依然不可替代，非算法岗位也能高薪

人工智能可以生成代码，但无法确保程序稳定运行；AI能够实现功能需求，但难以理解深层业务逻辑；缺乏自主进化能力；AI可以执行任务，但无法承担相应责任。那么，在人工智能时代，想要从事C++发展方向，该如何制定学习计划，如何确定求职目标？C++技术体系的学习范畴是什么？需要掌握到什么水平？AI相关知识哪些是必学内容？今天就针对上述问题，来详细探讨。C++在"微服务 + 分布式 + AI"这个融合领域，主要扮演高性能基础、推理引擎和低延时服务的角色。虽然许多业务微服务采用Go/Java开发，但涉及高并发、低延时、

2026-05-13 14:14:18 | 11 阅读

AI Infra：2026年AI产业核心战场，大模型成败的关键胜负手

万亿Token时代的残酷真相：每一次与AI的对话，都在消耗真实财富当你在对话框中输入问题，期望AI瞬间给出高质量回答时，或许从未想过：这个看似简单的操作背后，一场庞大而精密的工程正在静默运行。从模型接收指令到生成回答，中间需要经历框架转换、算子调用、任务调度、芯片运算、数据传输等一系列复杂的底层流程。支撑这一切运作的，正是当前AI产业最为火热的概念——AI Infra（AI基础设施）。先看一组令人震撼的数据：中国日均Token调用量从2024年初的约1000亿飙升至2025年底的100万亿，2026年3月

2026-05-12 21:31:51 | 34 阅读

AI 前沿速递 | 2026 年 05 月 11 日精选

AI 前沿速递 2026 年 05 月 11 日 · 闪哥聊 AI 1Mirage：专为 AI 代理打造的统一虚拟文件系统为 AI 代理构建统一的虚拟文件系统，优化文件访问与管理流程。GitHub 🔗 https://github.com/strukto-ai/mirage 2Yao Open Prompts：中文 AI 提示词宝库涵盖办公、学习、创作、营销及生活等多场景的中文提示词资源库。GitHub 🔗 https://github.com/yaojingang/yao-open-prompts

2026-05-11 12:04:08 | 24 阅读

AI前沿|文心5.1低成本登顶搜索榜，DeepSeek融资破纪录，OpenAI首届AI原生代毕业

1. 百度发布文心大模型5.1版本，以行业6%的预训练成本实现搜索榜登顶5月9日，百度推出新一代基础大模型文心5.1，运用"多维弹性预训练"技术，仅用同类模型约6%的预训练成本便达到基础性能领先水平。在LMArena大模型竞技场最新榜单中，文心5.1凭借1223分斩获国内搜索榜冠军、全球第四，成为唯一入围的国产模型。其智能体能力已反超DeepSeek-V4-Pro，创意文本生成水平媲美Gemini 3.1 Pro，推理性能逼近业界顶尖闭源模型。该模型将总参数缩减至约三分之一、激活参数压缩至约二分之一，体现

2026-05-09 13:46:23 | 30 阅读

AI新赛道：中美的两种打法

硅谷的科技巨头们，最近都在忙什么？他们把心思都花在下一代万亿级参数的大模型上，继续优化Attention机制，并打造更高效的推理引擎——换句话说，就是在做一把更牢靠的铲子。与此同时，另一边大洋彼岸的中国科技公司在做什么？他们则把AI做成你能想到的各类应用：智能客服、自动驾驶、内容生成、办公提效、医疗问诊——简单说，就是拿着铲子到处挖金子。这两种选择并没有谁更对、谁更错。但它也揭开了AI时代一个长期被低估的事实：中美两国正在走向截然不同的AI发展路线。很多人会问：中美AI到底差在哪里？答案其实很直观：美国人

2026-05-02 14:06:31 | 14 阅读

本地化AI部署指南

实现AI本地化部署已形成一套标准化流程。不仅包括模型的‘离线化’，还需考虑推理环境、知识库及权限体系的封装。以下是五个核心阶段：确定硬件资源，避免资源不足。算力评估：显存(VRAM)：依据模型大小计算，如14B模型在INT4量化下需约10GB，但建议预留24GB以上显存。架构适配：确认NVIDIA环境(CUDA驱动)或国产算力平台(NPU等)。模型选型：选用商用许可且中文能力强的模型(如DeepSeek、Qwen、Llama系列)。创建隔离可控运行环境。容器化(Docker/K8s)：确保开发和生产环境一

2026-04-04 08:06:37 | 38 阅读