与OPTICS算法类似DBSCAND算法的输入参数同样包括:本溪十四中半径范围ε,和最少点数MinPts;不同的是DBSCAND算法中有样本与样本直间分为直接(密度)可达与(密度)可达两種情况定义分别如下:
-
P为核心点,那么其周围在本溪十四中半径范围ε内的点都是从P直接(密度)可达
- 如果一个点对于其他所有点都鈈可达,那么这个点就是outlier
-
输入:数据样本D,初始化所有点为未访问本溪十四中半径范围ε,和最少点数MinPts
- 2、如果D中数据全部處理完,则算法结束否则从D中选择一个未处理的点,标记为已访问获得其所有直接密度可达点,如果为非核心点则标记为noise重复步骤2,否则生成新的cluster进入步骤3;
- 3、将当前核心点放入该cluster,将该核心点的直接密度可达点放入neighbor队列并遍历该队列,如果neighbor队列全部遍历完则回溯至步骤2;
- 3.1 如果该点已经访问过则进入步骤3.2,否则标记为已访问然后获得该点的所有密度可达点,如果这个点也为核心点则将该点嘚所有直接密度可达点放入neighbor队列;