基于密度的聚類方法,依據樣本空間中點的密度,對樣本進行聚類的算法中,預期要發(fā)現(xiàn)的簇是由滿足預定樣本數(shù)量閾值要求的點集組成,并且不同的類簇由樣本數(shù)閾值低于指定值的點集( 離群點集合) 分割?;诿芏鹊乃惴ㄗ罱K要滿足過濾密度低于閾值的樣本區(qū)域,發(fā)現(xiàn)密度等于或高于指定閾值的區(qū)域。在此類算法中,無需指定簇的數(shù)量?;诿芏染垲惙椒梢杂糜诳臻g數(shù)據的聚類。數(shù)據挖掘領域中典型的基于密度的算法有:1) DBSCAN。依據用戶給定參數(shù),不斷發(fā)現(xiàn)給定半徑內的點數(shù)達到指定數(shù)量的高密度區(qū)域,并不斷生長高密度區(qū)域。2) DENCLUE。聚類過程中依據樣本點在指定空間中的密度進行聚類。3) OPTICS、DBCLASD、CURD。這些算法中,針對數(shù)據在數(shù)據集中呈現(xiàn)出的高密度區(qū)域的形狀和密度,對DBSCAN 做了些補充或修正。以上3 種基于密度的聚類算法中,DBSCAN 聚類算法是一種常用的聚類算法。算法執(zhí)行過程中,首先需要指定類簇的半徑域Eps 和最小對象數(shù)目Min Pts;然后根據Eps 和Min Pts 判斷對象集中的對象的屬性( 即核心點、邊界點、噪聲) ; 最后根據當前對象屬性判斷當前對象域是否構成一個類簇,并依據此方法判斷數(shù)據集中每個點的屬性。DBSCAN 算法可以對農業(yè)機械作業(yè)軌跡圖像點進行密度識別,挖掘其分布特征,并找到軌跡點較密的區(qū)域,從而發(fā)現(xiàn)軌跡點較集中的簇,可以識別軌跡中離群點。該算法的特點是可以挖掘不同形狀的類簇,可以有效地排除離群點,同時較適合空間和時間軌跡數(shù)據的聚類。實踐證明: 算法對Eps 和Min Pts 的設置較敏感,如設置不當可能造成聚類效果下降。依據農業(yè)機械田間作業(yè)軌跡數(shù)據的特征,本研究選擇DBSCAN 作為軌跡聚類算法。農業(yè)機械軌跡聚類流程如下:1) 算法輸入。作業(yè)周期內時空軌跡數(shù)據、半徑Eps 和最小軌跡數(shù)Min Pts。2) 算法輸出。農業(yè)機械作業(yè)軌跡類簇集。方法:1) 放入所有軌跡點到Data Point 庫,從Data Point隨機取出一個點。2) IF Eps領域中至少包含Min Pts個軌跡點,THEN 記當前點為核心軌跡點,并創(chuàng)建一個簇,放入其到簇庫C 中。ELSE IF 當前點是邊界點,THEN歸入所屬簇ELSE判斷其為離群點。3) 從Data Point 庫中隨機取出下一個點。4) 并重復步驟2) 和3) ,直到所有點處理完畢。