機器學習_學習筆記系列(48):半徑鄰近演算法分類(Radius Neighbor Classification)

--

前兩個章節我們介紹如何運用kNN來解決分類和回歸上的問題,在kNN裡面我們是從訓練資料集選出k個距離最近的點。而我們今天要介紹另一個非常像的演算法Radius Neighbor

Radius Neighbor

對於Radius Neighbor其想法也相當值觀,就是當我們選到一個點的時候,我們會從我們設定的固定半徑裡面,看看有那些訓練集資料落在裡面,然後再看看們的類別是什麼,選出類別最多的即為該點的預測類別。若半徑裡面沒有任何的資料點,我們就選離最近的。

接下來我們一樣來看看Radius Neighbor的效能

我們可以看到當半徑R越大,我們的邊界線也會變得越來越平滑,也就是我們模型的泛話能力會越來越好,但是相同的如果我們所選的半徑R過大,對於一些局部的區域,就無法很好的catch到我們想要的結果。

Python Sample Code:

Github:

Reference:

[1] Scikit-learn: Machine Learning in Python, Pedregosa et al., JMLR 12, pp. 2825–2830, 2011.

--

--

劉智皓 (Chih-Hao Liu)
劉智皓 (Chih-Hao Liu)

Written by 劉智皓 (Chih-Hao Liu)

豬屎屋AI RD,熱愛AI研究、LLM/SD模型、RAG應用、CUDA/HIP加速運算、訓練推論加速,同時也是5G技術愛好者,研讀過3GPP/ETSI/O-RAN Spec和O-RAN/ONAP/OAI開源軟體。

No responses yet