混合架构新突破!HMSTUNet刷新人群计数性能纪录
计算机视觉领域再次传来重磅消息!研究团队Yue Zhang、Yafu Li、Leyang Cui(通讯作者)等学者联合发布HMSTUNet混合多尺度Transformer-CNN U型网络,创新性整合CNN局部特征提取能力与Transformer全局建模优势,成功破解人群计数难题,在五大权威基准数据集上全面刷新SOTA性能。DOI:https://doi.org/10.1162/COLI.a.16当前人群计数算法主要分为CNN与Transformer两大技术路线,但各自存在明显局限:CNN网络感受野范围有