《模式识别与人工智能》第39卷 第1期
智慧起航,共创未来
论文与报告
面向无监督磁共振图像配准的多窗口多层感知机特征金字塔网络
于寒1, 孙正1,2, 张胜楠1, 高章硕1, 丁港澳1
1.华北电力大学 电子与通信工程系 保定 071003; 2.华北电力大学 河北省电力物联网技术重点实验室 保定 071003
摘要:无监督磁共振图像(Magnetic Resonance Imaging, MRI)配准的主流方法通常基于卷积神经网络或Transformer架构,但二者均存在明显局限:卷积神经网络受局部感受野限制,难以建模长距离依赖;Transformer的自注意力机制计算复杂度较高,通常无法在全分辨率下实现精细配准.为此,文中提出基于多窗口多层感知机的特征金字塔网络(Multi-window Multi-layer Perceptron Feature Pyramid Network, PyraMLP-Net),旨在实现高效、精准的全分辨率脑部MRI配准.首先,设计权重共享特征提取模块,通过并行的双路卷积编码,从一对图像中提取多尺度特征.然后,构建特征金字塔解码模块,以相关感知多窗口多层感知机为核心,通过自下而上的路径,逐步融合不同尺度的特征信息,实现变形场的由粗到精优化.最后,设计空间变换网络模块,以变形场为参数,对待配准图像进行可微分重采样,生成最终配准结果.在3个公开脑部MRI数据集上的实验表明,PyraMLP-Net在配准精度、稳定性和效率方面均较优.
关键词:脑部磁共振成像, 医学图像配准, 多层感知机, 无监督学习
引用本文:
于寒, 孙正, 张胜楠, 高章硕, 丁港澳. 面向无监督磁共振图像配准的多窗口多层感知机特征金字塔网络[J]. 模式识别与人工智能, 2026, 39(1): 2-30.
YU Han, SUN Zheng, ZHANG Shengnan, GAO Zhangshuo, DING Gang'ao. Multi-window Multi-layer Perceptron Feature Pyramid Network for Unsupervised MRI Image Registration. Pattern Recognition and Artificial Intelligence, 2026, 39(1): 2-30.
链接本文:
http://manu46.magtech.com.cn/prai/CN/10.16451/j.cnki.issn1003-6059.202601001
基于双重并行任务的无人机小目标两阶段检测方法
杨艺1,2, 朱江睿1,2, 王科平1,2, 张高鹏3, 钱伟1,2, 王田4
1.河南理工大学 电气工程与自动化学院 焦作 454003; 2.河南理工大学 河南省智能装备直驱技术与控制国际联合实验室 焦作 454003; 3.中国科学院西安光学精密机械研究所 西安市飞行器光学成像监视与测量技术研究室 西安 710119; 4.北京航空航天大学 人工智能学院 北京 10008
摘要:目标在图像中的尺寸过小是无人机目标检测面临的主要挑战之一,特别是当无人机飞行高度较高且成像分辨率较低时,小目标特征极易在深度神经网络的深层特征中弥散.为此,文中提出基于双重并行任务的无人机小目标两阶段检测方法,并行任务包含小目标检测任务与超分辨率重建任务.在超分辨率重建任务分支中,构建空间先验模块和窗口注意力引导模块.小目标检测任务分支以Swin Transformer为基础,并且分别由空间先验模块和窗口注意力引导模块进行浅层特征的空间信息和深层特征的注意力的超分辨率重建.两阶段检测方法分为训练阶段和推理阶段.在训练阶段,超分辨率重建任务分支均以高分辨率特征为标签,从而增强小目标检测任务分支对细节特征的提取能力.在推理阶段,仅保留小目标检测任务分支,可提升方法的推理速度,降低资源开销.在公共数据集VisDrone和自制无人机数据集JZ-UAV上的实验表明,文中方法识别精度较高.
关键词:无人机(UAV), Swin Transformer, 小目标检测, 超分辨率重建
引用本文:
杨艺, 朱江睿, 王科平, 张高鹏, 钱伟, 王田. 基于双重并行任务的无人机小目标两阶段检测方法[J]. 模式识别与人工智能, 2026, 39(1): 31-51.
YANG Yi, ZHU Jiangrui, WANG Keping, ZHANG Gaopeng, QIAN Wei, WANG Tian. Dual-Branch Two-Stage Detection for Small Objects in UAV Images. Pattern Recognition and Artificial Intelligence, 2026, 39(1): 31-51.
链接本文:
http://manu46.magtech.com.cn/prai/CN/10.16451/j.cnki.issn1003-6059.202601002
研究与应用
基于高阶相关性与双重冗余驱动的全局多标签特征选择
邓文1, 折延宏2, 郑文利2, 贺晓丽2, 钱婷2
1.西安石油大学 计算机学院 西安 710065; 2.西安石油大学 理学院 西安 710065
摘要:多标签特征选择是处理高维多标签数据的关键预处理技术.现有方法或因采用贪婪搜索策略而容易陷入局部最优,或在稀疏模型中对特征相关性与冗余性的度量不够充分.为此,文中提出基于高阶相关性与双重冗余驱动的全局多标签特征选择算法(Global Multi-label Feature Selection Algorithm Driven by Higher-Order Correlation and Dual Redundancy, GHC-DR).首先,引入基于多标签k近邻的模糊依赖度,准确评估特征与标签系统间的高阶相关性.然后,专注于特征的局部几何结构,构建特征图,捕捉特征间的局部相似性,并设计融合信息论与局部结构的双重冗余评估机制.最后,将高阶相关性、双重冗余性及标签相关性整合至一个统一的稀疏学习目标函数中,并给出高效的闭式解.在15个公开多标签基准数据集上的对比实验表明,GHC-DR在多个评估指标上均表现出性能优势.
关键词:模糊粗糙集, 特征选择, 多标签学习, 特征冗余
引用本文:
邓文, 折延宏, 郑文利, 贺晓丽, 钱婷. 基于高阶相关性与双重冗余驱动的全局多标签特征选择[J]. 模式识别与人工智能, 2026, 39(1): 52-66.
DENG Wen, SHE Yanhong, ZHENG Wenli, HE Xiaoli, QIAN Ting. Global Multi-label Feature Selection Driven by Higher-Order Correlation and Dual Redundancy. Pattern Recognition and Artificial Intelligence, 2026, 39(1): 52-66.
链接本文:
http://manu46.magtech.com.cn/prai/CN/10.16451/j.cnki.issn1003-6059.202601003
高时间步长友好的分片并行脉冲神经元模型
赖剑翔1, 黄昉菀1,2,3, 吴越钟1,2,3, 於志勇1,2,3
1.福州大学 计算机与大数据学院 福州 350108; 2.福州大学 大数据智能教育部工程研究中心 福州 350108; 3.福州大学 福建省网络计算与智能信息处理重点实验室 福州 350108
摘要:脉冲神经网络在时间序列预测领域面临时序映射难以平衡计算效率与信息处理能力,并行脉冲神经元在高时间步长拓展能力不足、容易陷入局部最优等问题.为此,文中提出高时间步长友好的分片并行脉冲神经元模型(High-Time-Step-Friendly Slice Parallel Spiking Neuron, HSPSN).首先,通过直接时序映射方法实现时间步的一对一匹配.然后,设计局部切片与全局切片协同的分片并行机制,实现局部与全局时序模式在神经元层面的整合.最后,采用收缩矩阵随机丢弃方法,有效引导神经元达到更优收敛.在7个真实世界时间序列预测数据集上的实验表明,HSPSN在预测精度、能耗效率及收敛稳定性等方面均较优,可有效提取多元时间序列和协变量时间序列的复杂时空依赖.
关键词:脉冲神经网络, 并行脉冲神经元, 时间序列预测, 时序映射
引用本文:
赖剑翔, 黄昉菀, 吴越钟, 於志勇. 高时间步长友好的分片并行脉冲神经元模型[J]. 模式识别与人工智能, 2026, 39(1): 67-82.
LAI Jianxiang, HUANG Fangwan, WU Yuezhong, YU Zhiyong. High-Time-Step-Friendly Slice Parallel Spiking Neuron. Pattern Recognition and Artificial Intelligence, 2026, 39(1): 67-82.
链接本文:
http://manu46.magtech.com.cn/prai/CN/10.16451/j.cnki.issn1003-6059.202601004
频域增强自适应通道注意力与特征金字塔融合的可逆流网络风格迁移
葛斌1,2, 邵孜绎1,2, 郑军帅1, 夏晨星1, 官骏鸣3, 徐涛1
1.安徽理工大学 煤炭无人化开采数智技术全国重点实验室淮南 232001; 2.安徽理工大学 计算机科学与工程学院 淮南 232001; 3.黄山学院 信息工程学院 黄山 245041
摘要:针对风格迁移中内容失真、出现伪影与频域特性利用不足的问题,文中提出基于频域增强自适应通道注意力与特征金字塔融合的可逆流网络风格迁移方法.首先,以预训练VGG19为基础架构,设计可逆流网络,利用无偏差特征传递机制减少特征损耗,保障内容结构的完整性.然后,设计频域增强自适应通道注意力模块,解析风格图像频域分布,建立内容特征与风格特征的精准关联,提升风格化效果.最后,构建特征金字塔融合模块,对齐全局风格与局部纹理,提升迁移结果协调性.在MS-COCO、WikiArt数据集上的实验表明,文中方法能平衡风格传递与内容保留,在内容结构完整性、风格化效果及计算效率上均较优.
关键词:计算机视觉, 深度学习, 风格迁移, 自注意力机制
引用本文:
葛斌, 邵孜绎, 郑军帅, 夏晨星, 官骏鸣, 徐涛. 频域增强自适应通道注意力与特征金字塔融合的可逆流网络风格迁移[J]. 模式识别与人工智能, 2026, 39(1): 83-96.
GE Bin, SHAO Ziyi, ZHENG Junshuai, XIA Chenxing, GUAN Junming, XU Tao. Reversible Flow Network for Style Transfer Based on Frequency-Domain Enhanced Adaptive Channel Attention and Feature Pyramid Fusion. Pattern Recognition and Artificial Intelligence, 2026, 39(1): 83-96.
链接本文:
http://manu46.magtech.com.cn/prai/CN/10.16451/j.cnki.issn1003-6059.202601005