粒球计算研究获重要突破
近日,人工智能与计算机学院(智慧教育学院)杜明晶副教授指导的硕士生王淇甲在粒球计算领域取得重要研究进展。相关成果发表于人工智能顶级期刊《IEEE Transactions on Fuzzy Systems》(SCI一区,CCF-B)和《Information Sciences》(SCI二区,CCF-B)
进展一:
AFGBStream:基于滑动窗口的自适应模糊粒球数据流聚类
1
期刊介绍
《IEEE Transactions on Fuzzy Systems》是全球模糊系统领域的顶级期刊,主要刊载模糊逻辑、模糊集合理论和模糊系统等方面的最新研究成果。该期刊属于中科院SCI一区期刊,CCF-B/CAAI-B类期刊,影响因子为11.9。
论文介绍
研究动因:当前基于滑动窗口的数据流聚类方法仍面临挑战。一方面,许多方法使用单粒度处理机制(例如,使用固定半径阈值的微簇模型),无法充分捕获数据流中固有的多密度结构。另一方面,滑动窗口模型通常以固定速率更新数据窗口,导致对突然模式变化的响应延迟,这可能会对聚类结果的及时性和稳定性产生负面影响。
核心思路:本文提出了一种使用滑动窗口框架的自适应聚类方法。该方法在三阶段处理框架内利用模糊集理论和粒球计算来实现数据流聚类的动态优化。首先,在数据摄取阶段,AFGBStream采用窗口引导的数据粒化策略,该策略使用模糊分区机制将传入的数据流在线转换为自适应粒球。接下来,在模型更新阶段,微球进化机制通过生成、扩展、分裂、移除、收缩和消除操作动态维护基本聚类单元。最后,在聚类形成阶段,对当前窗口内的活跃微球进行聚类操作。
关键结果:在17个流数据的基准数据集进行的全面实验评估表明,AFGBStream比五种竞争方法实现了卓越的性能。
图 1:算法框架
作者简介
王淇甲:江苏师范大学人工智能与计算机学院(智慧教育学院)2023级计算机技术专业硕士研究生;
杜明晶:江苏师范大学人工智能与计算机学院(智慧教育学院)副教授、硕士生导师;
丁卫平:南通大学人工智能与计算机学院教授。
进展二:
结构感知的粒球聚类
期刊介绍
《Information Sciences》是信息科学与人工智能领域的权威顶级期刊,具有深远的学术影响力。该刊主要刊载人工智能、机器学习、模糊系统与软计算、数据科学、复杂网络及其在各领域应用等方面的最新研究成果。该期刊属于中科院SCI二区期刊,CCF-B类期刊,影响因子为6.8。
研究动因:现有粒球生成方法的计算效率低下,这些方法始终依赖于整个数据集的递归分裂操作,随着数据量的增长,它们变得越来越不切实际。其次,在现有粒球生成中使用硬分区方案(其中每个数据点被严格分配给单个粒球)可能会在聚类过程中导致人为边界,这可能会扭曲自然聚类结构,特别是在具有密度转变的区域。最后,在聚类阶段,大多数现有的粒球合并机制仅依赖于单一的基于距离的标准,忽略了可以更好地反映底层数据拓扑的其他连接信息,导致聚类结果不令人满意。
核心思路:本文提出了一种针对大规模数据量身定制的结构感知粒球聚类框架。在粒球生成阶段,对代表性子集进行采样以生成捕获全局结构模式的粒球,并通过高斯核构建软隶属图以保留后续相似性计算的基本拓扑关系。在粒球连接阶段,基于空间邻近性和结构相似性的双重约束,建立粒球之间的连通性,从而产生它们的连通分量。最后,通过软关联图将标签从关联最强的粒球传播到每个数据点,从而导出聚类分配。
关键结果:对17个合成数据集和真实数据集的大量实验表明,SAGBC比10个基线方法实现了更高的聚类精度和计算效率,验证了其对大规模数据分析的有效性。
图 2:算法框架
作者简介
王淇甲:江苏师范大学人工智能与计算机学院(智慧教育学院)2023级计算机技术专业硕士研究生;
杜明晶:江苏师范大学人工智能与计算机学院(智慧教育学院)副教授、硕士生导师。
排版丨匡奕侯先泉
一审丨黄有玉
二审丨祝义
三审丨董永权