pythonK-NN算法的優(yōu)缺點
本文教程操作環(huán)境:windows7系統(tǒng)、Python3.9.1,DELLG3電腦。
1、優(yōu)點
(1)簡單而有效
(2)再培訓成本低。
(3)適合跨領域的抽樣。
基于KNN的方法主要依賴于附近有限個樣本,而基于類域的KNN方法則不能確定其所屬的類類,所以KNN方法更適合于類域有較多交叉或重疊的待分樣本集。
(4)適用于各種樣本量的分類。
所提出的方法適用于類域中具有較大樣本容量的類動態(tài)分類,而類域中具有較大樣本容量的類動態(tài)分類更易產生錯誤。
2、缺點
(1)是惰性學習。
KNN算法是一種懶散的學習方法(lazylearning,基本不學習),?次主動學習算法速度要快得多。
(2)類評分未規(guī)格化。
不同之處在于通過概率評分進行分類。
(3)輸出的可解釋性較差。
比如,決策樹的輸出可以很好地解釋。
(4)不善于處理不均衡的樣品。
在樣本不平衡時,例如?個類的樣本容量很小,而其它類的樣本容量很小,就有可能導致當一個新樣本出現(xiàn)在同一K個鄰域中時,在該類的K個鄰域中占多數(shù)。這個算法只計算“最近的”鄰域樣本,其中一類樣本的個數(shù)很小,那么這類樣本可能與另一類樣本的個數(shù)不近,或者這類樣本與另一類樣本的個數(shù)不近。然而,量的大小并不會影響到操作結果。對此,可采用一種改進的同位素同位素同位素同位素法(即同位素離位素同位素同位素同位素)。
以上就是pythonK-NN算法優(yōu)缺點的介紹,希望能對大家有所幫助。更多Python學習教程請關注IT培訓機構:千鋒教育。