第八届京高校AI论坛：聚焦AI芯片与算力分论坛

发布时间：2026-05-21 21:33阅读：13

人工智能.未来

北京高校人工智能学术盛会

第八届

AI芯片与算力

专题预告

2026/05/24 14:00-17:00

北京中关村皇冠假日酒店多功能厅B未来

AI芯片与算力

专题简介

为推动北京高校学生在智能技术领域的深度交流与成果展示，北京高校人工智能联盟定于2026年5月23日至24日于北京中关村皇冠假日酒店举办“AI.未来—第八届北京高校人工智能学术论坛”，诚邀您参与5月24日14:00-17:00的AI芯片与算力分论坛。报名方式请见文末。

主论坛由中国科学院计算技术研究所与北京大学软件与微电子学院联合主办，共邀请3位知名学者、3名学生进行报告。以下为分论坛内容简要介绍。

AI.未来

专家报告

刘天义

中国科学院计算技术研究所

副研究员

刘天义博士，中科院计算所副研究员。研究方向为：计算机系统结构、云渲染基础设施、香山AI基础设施。目前主要负责“通推一体”香山AI处理器开源RTL代码的工程落地和芯片敏捷开发方法的研究。

报告主题

“通推一体”香山RISC-V AI处理器

微架构及开源IP研发

报告摘要

生成式AI推理日新月异、蓬勃发展（例如大语言模型、多模态、智能体等），日常生活中的应用软件同步呈现“智能化”趋势。智能化软件是在传统软件基础上增加AI推理功能，因此体现出对传统通用计算和新兴AI推理兼需的趋势。本研究分享了如何为香行数增加矩阵计算能力，从而将纯粹的通用计算CPU升级为兼顾“通用计算”和“AI推理”的“通推一体”香山AI CPU。与此同时，将详细分享“通推一体”香山RISC-V AI 处理器的微架构、AI推理性能、软件编程模式及开源IP研发进展。

范志华

中国科学院计算技术研究所

助理研究员

范志华博士，中国科学院计算技术研究所助理研究员，2024年博士毕业于中国科学院计算技术研究所。研究方向包含众核处理器芯片设计、AI加速架构设计、数据流体系结构。主持国家自然科学基金青年项目和国家抢占科技制高点重大专项子课题，发表学术论文40余篇，授权/受理国家发明专利30余项，论文入选ISCA最佳论文提名、HPC China优秀论文提名等，曾获中国科学院院长奖、北京市优秀毕业生、计算所所长奖等荣誉。

报告题目

基于数据流技术的边缘大模型推理加速研究

路畅

沐刃科技

CEO

路畅，清华大学工学博士，清华大学创业协会副会长，入选中国人工智能创业者U25榜单，长期聚焦算电协同调度方向研究，已发表高水平论文4篇，作为第一发明人拥有专利及软件著作权4项。两次获得国家奖学金、清华大学一等奖学金、雷军卓越奖学金（雷军先生颁奖）；曾获第八届中国国际大学生创新大赛国家金奖、清华挑战杯亚军、清华大学“校长杯”季军、东升杯一等奖等创业荣誉。

报告题目

算电协同背景下构筑分布式算网的一些思考

学生报告

裴旻楠

中国科学院自动化研究所

报告题目

GCC: A 3DGS推理架构与高斯条件处理

报告摘要

3D高斯点阵化(3DGS)已成为高保真视图合成的主流神经渲染技术，促使了专用的3DGS加速器的发展。传统解耦预处理-渲染数据流在现有加速器中有两个主要限制：1)预处理的高斯点阵化未被用于渲染；2)相同高斯点阵在不同tile渲染中重复加载，导致大量计算和数据移动开销。为解决这些问题，我们提出了一个新架构，该架构具有以下特点：1)跨阶段条件处理，将预处理和渲染交错，动态跳过不必要的高斯预处理；2)高斯点阵化，确保给定高斯的所有渲染操作在移动到下一个之前完成，从而消除重复的高斯加载。我们还提出了一种基于alpha的边界识别方法，以获得紧凑而准确的高斯区域，从而降低渲染成本。我们采用28nm技术实现我们的GCC加速器。实验表明，GCC在性能和能效方面显著优于目前最先进的3DGS推理加速器GSCore。

李崇骁

中国科学院大学

报告题目

大模型驱动的处理器电路

自动设计、验证与优化

报告摘要

随着芯片复杂度持续提升，处理器设计需求与设计资源之间的矛盾日益突出。代码大模型在软件工程中已取得显著进展，但在硬件设计领域距离实际应用仍有较大差距，基础模型能力和应用方法仍需进一步发展。大模型用于芯片设计主要面临四方面挑战：高质量数据不足、设计抽象层级跨度大、模态多样以及优化目标复杂。围绕这些问题，本报告将介绍实验室围绕处理器电路逻辑设计、形式验证和PPA优化开展的一系列工作，包括基础模型、测试基准和Agent框架。这些工作对大模型驱动的处理器设计新流程进行了初步探索。

刘洋

中国科学院计算技术研究所

报告题目

Hardwired-Neuron语言处理单元作为通用认知基底

报告摘要

大型语言模型（LLM）的快速发展已确立语言作为核心通用认知基底，推动了为LLM推理量身定制的专用语言处理单元（LPU）的需求。为克服LLM推理系统日益增长的能耗，本文提出了一种硬接线神经元语言处理单元（HNLPU），它将LLM参数物理地硬连接到计算结构中，通过极端专业化实现几个数量级的计算效率提升。然而，现代LLM的规模仍然面临重大挑战。直接硬连接GPT-OSS-120B将需要制造价值超过60亿美元的光刻掩模组，这使得这一解决方案在经济上不可行。

为解决这一挑战，我们提出了新的金属嵌入方法。而不是在二维硅器件单元网格中嵌入权重，金属嵌入将权重参数嵌入到金属线的三维拓扑中。这带来了两个好处：1)15倍的密度提升，以及2)70个光罩层中的60个是芯片间均匀的，包括所有EUV光罩。总的来说，金属嵌入将光罩成本降低了112倍，将HNLPU的非经常性工程成本（NRE）带入经济可行的范围。实验结果表明，HNLPU实现了249,960个令牌/秒（GPU/WSE的5,555×/85×），36个令牌/焦耳（GPU/WSE的1,047×/283×），总芯片面积13,232平方毫米，5米制程下估计NRE为59.46 M-123.5 M。分析表明，HNLPU在成本效益上实现了41.7-80.4倍的提升，碳足迹减少了357倍，与OpenAI规模H100集群相比，在年度权重更新假设下。

AI.未来

分论坛海报

裴旻楠等

作者单位：中国科学院大学

海报题目：GCC: 一种具有高斯条件处理的3DGS推理架构

曾辉等

作者单位：北京中关村学院

海报题目

VectorWeaver: 一种面向边缘平台的LLM推理的阶段感知自动化优化框架

观众报名

本届论坛将继续面向全国高校与科研院所免费开放，不收取任何费用，为北京高校师生呈现人工智能的学术盛宴。诚挚邀请意向参加本届学术论坛的嘉宾填写以下问卷进行报名，我们真诚期待您的参与！

我们诚挚邀请全国高校及科研院所的研究生、青年学者积极参与，共赴这场人工智能学术盛宴！

主办单位

中国科学院自动化研究所研究生会

清华大学自动化系研究生会

承办单位

中国科学院软件研究所研究生会

北京邮电大学计算机学院(国家示范性软件学院)研究生会

中国科学院计算技术研究所研究生会

北京大学软件与微电子学院

北京航空航天大学自动化科学与电气工程学院

北京交通大学自动化与智能学院

北京理工大学自动化学院

北京科技大学人工智能学院

中国医学科学院阜外医院

中国科学院计算机网络信息中心

中国科学院大学人工智能学院

特别鸣谢

感谢所有参与本次论坛的单位和人员，以及所有支持单位。

关键词：AI芯片, 算力, 分布式计算, 人工智能, 研究生会, 计算所, 学术论坛, 报名

← 上一篇：金发科技特种塑料近三成用于AI产业下一篇：第八届北京高校AI论坛企业专场预告 →