Page 102 - 2025年第56卷第5期
P. 102

图 1 研究框架与流程图
































                                                 图 2 知识图谱构建框架与流程图

              2.3 涉及算法及软件
                  (1)场景分类算法:分类指根据有标签的训练集,判别目标样本所属类别。因分类算法标注训练
              集工作量巨大,选用聚类-分类模式                 [12] 进行场景分类。即通过聚类算法将不带标签的样本集聚成相似
              的多个簇,形成带标签的训练集,在此基础上进行场景分类,能提高分类算法标注训练集的效率,克
              服分类算法计算量大、不灵活等缺点,具有可伸缩性,能有效缩短计算时间                                    [13] 。本研究首先进行分类
              因子的提取;然后,使用主成分分析(Principal Component Analysis,PCA),进行分类因子降维,得到
              样本数据到新坐标的映射值;最后,采用密度聚类-随机森林(Density-Based Spatial Clustering of Appli⁃
                                                                                     [14]
              cations with Noise-Random Forest,DBSCAN-RF)算法实现场景分类。DBSCAN                是一种基于密度的聚
              类算法,具有无需预先设置初始聚类中心、鲁棒性强及受噪声影响小等优点,只需设置扫描半径
             (Eps)和最小包含点数(k)2 个参数,聚类效果可通过轮廓系数判断                           [15] 。对于实时场景,采用随机森林
             (Random Forest,RF) 分类算法确定调度模式。RF 是一种基于多分类器集成数据的分类算法,其分
                                 [16]
                — 648   —
   97   98   99   100   101   102   103   104   105   106   107