KNN智能分類算法的基本思想是計(jì)算訓(xùn)練樣本和新樣板之間的距離,然后找到最近的 K 個(gè)相鄰樣本數(shù)據(jù),根據(jù)這些相鄰樣本數(shù)據(jù),來判定新的樣本類別。如果屬于同一類,則判定樣本屬于這個(gè)類別; 如果不屬于這個(gè)類別,則對候選類別進(jìn)行評(píng)分,按照規(guī)則確定新樣本的類別。最后,把新的測試樣本歸類到最近的 K 個(gè)訓(xùn)練樣本中出現(xiàn)頻率最大的。使用 KNN算法分類是基于臨近樣本數(shù)據(jù)具有類似的預(yù)測值,基本思想是在多維空間 Rn中搜索未知樣本,找到與未知樣本最近鄰的 K 個(gè)點(diǎn),并根據(jù) K 個(gè)點(diǎn)來判斷未知的樣本數(shù)據(jù)。這 K 個(gè)點(diǎn)便是待分類樣本的 k - 最近鄰。綜合上述過程,對基于 KNN 算法的農(nóng)機(jī)虛擬云制造系統(tǒng)設(shè)計(jì)過程如下:1) 尋找合適的農(nóng)機(jī)部件制造服務(wù)候選資源訓(xùn)練數(shù)據(jù)集。農(nóng)機(jī)部件制造服務(wù)候選資源訓(xùn)練數(shù)據(jù)集需要對歷史數(shù)據(jù)具有很好的覆蓋功能,這樣才有利于對近鄰的預(yù)測。選取的訓(xùn)練數(shù)據(jù)要有代表性,既要保證訓(xùn)練樣本數(shù)據(jù)集的大小,又要保證數(shù)據(jù)集的精度。2) 確定距離函數(shù)。距離函數(shù)的選取比較重要,決定哪些服務(wù)候選資源是 K 個(gè)待分類的近鄰,其選取取決于實(shí)際的數(shù)據(jù)和決策。如果樣本是空間上分布的點(diǎn),則可以選用歐幾里得距離。3) 決定 K 取值。K 值的選取對分類影響較大,一般可以初始確定一個(gè)值,通過不斷調(diào)試,得到合適的值。4) 確定候選資源的類別。候選資源的最終確定可以根據(jù)類別中出現(xiàn)頻率最高的來選擇,如果最高的不只一個(gè),可以選擇最近鄰的。農(nóng)機(jī)部件制造服務(wù)候選資源的選擇,可以有效地縮短農(nóng)機(jī)制造的整個(gè)設(shè)計(jì)和加工流程,從而提高農(nóng)機(jī)現(xiàn)代化設(shè)計(jì)和制造的效率。