Java實現(xiàn)的KNN算法示例
本文實例講述了Java實現(xiàn)的KNN算法。分享給大家供大家參考,具體如下:
提起KNN算法大家應(yīng)該都不會陌生,對于數(shù)據(jù)挖掘來說算是十大經(jīng)典算法之一。
算法的思想是:對于訓(xùn)練數(shù)據(jù)集中已經(jīng)歸類的分組,來對于未知的數(shù)據(jù)進行分組歸類。其中是根據(jù)該未知點與其訓(xùn)練數(shù)據(jù)中的點計算距離,求出距離最短的點,并將其歸入該點的那一類。
看看算法的工程吧:
1. 準(zhǔn)備數(shù)據(jù),對數(shù)據(jù)進行預(yù)處理
2. 選用合適的數(shù)據(jù)結(jié)構(gòu)存儲訓(xùn)練數(shù)據(jù)和測試元組
3. 設(shè)定參數(shù),如k
4.維護一個大小為k的的按距離由大到小的優(yōu)先級隊列,用于存儲最近鄰訓(xùn)練元組。隨機從訓(xùn)練元組中選取k個元組作為初始的最近鄰元組,分別計算測試元組到這k個元組的距離,將訓(xùn)練元組標(biāo)號和距離存入優(yōu)先級隊列
5. 遍歷訓(xùn)練元組集,計算當(dāng)前訓(xùn)練元組與測試元組的距離,將所得距離L 與優(yōu)先級隊列中的最大距離Lmax
6. 進行比較。若L>=Lmax,則舍棄該元組,遍歷下一個元組。若L < Lmax,刪除優(yōu)先級隊列中最大距離的元組,將當(dāng)前訓(xùn)練元組存入優(yōu)先級隊 列。
7. 遍歷完畢,計算優(yōu)先級隊列中k 個元組的多數(shù)類,并將其作為測試元組的類別。
8. 測試元組集測試完畢后計算誤差率,繼續(xù)設(shè)定不同的k值重新進行訓(xùn)練,最后取誤差率最小的k 值。
根據(jù)算法的過程我們進行java語言實現(xiàn):
package KNN; /** * 點的坐標(biāo) x 、y * @author Administrator * */ public class PointBean { int x; int y; public int getX() { return x; } public void setX(int x) { this.x = x; } public int getY() { return y; } public void setY(int y) { this.y = y; } public PointBean(int x, int y) { super(); this.x = x; this.y = y; } public PointBean() { super(); } @Override public String toString() { return "PointBean [x=" + x + ", y=" + y + "]"; } }
KNN算法
package KNN; import java.util.ArrayList; /** * KNN實現(xiàn)的方法 * @author Administrator * */ public class KnnMain { public double getPointLength(ArrayList<PointBean> list,PointBean bb){ int b_x=bb.getX(); int b_y=bb.getY(); double temp=(b_x -list.get(0).getX())*(b_x -list.get(0).getX())+ (b_y -list.get(0).getY())*(b_y -list.get(0).getY()); // 找出最小的距離 for(int i=1;i<list.size();i++){ if(temp<((b_x -list.get(i).getX())*(b_x -list.get(i).getX())+ (b_y -list.get(i).getY())*(b_y -list.get(i).getY()))){ temp=(b_x -list.get(i).getX())*(b_x -list.get(i).getX())+ (b_y -list.get(i).getY())*(b_y -list.get(i).getY()); } } return Math.sqrt(temp); } /** * 獲取長度,找出最小的一個進行歸類 * @param list1 * @param list2 * @param list3 * @param bb */ public void getContent(ArrayList<PointBean> list1,ArrayList<PointBean> list2, ArrayList<PointBean> list3,PointBean bb){ double A=getPointLength(list1,bb); double B=getPointLength(list2,bb); double C=getPointLength(list3,bb); //做出比較 if(A>B){ if(B>C){ System.out.println("這個點:"+bb.getX()+" , "+bb.getY()+" " +"屬于C"); }else { System.out.println("這個點:"+bb.getX()+" , "+bb.getY()+" " +"屬于B"); } }else { if(A>C){ System.out.println("這個點:"+bb.getX()+" , "+bb.getY()+" " +"屬于C"); }else { System.out.println("這個點:"+bb.getX()+" , "+bb.getY()+" " +"屬于A"); } } } }
主函數(shù)
package KNN; import java.util.ArrayList; /* * 主函數(shù) KNN */ public class TestJava { static ArrayList< PointBean> listA; static ArrayList< PointBean> listB; static ArrayList< PointBean> listC; static ArrayList< PointBean> listD; public static void main(String[] args) { //創(chuàng)佳Arraylist listA=new ArrayList<PointBean>(); listB=new ArrayList<PointBean>(); listC=new ArrayList<PointBean>(); listD=new ArrayList<PointBean>(); //寫入數(shù)據(jù) setDate(); getTestResult(); } /** * 得到結(jié)果 */ private static void getTestResult() { //創(chuàng)建對象 KnnMain km=new KnnMain(); for(int i=0;i<listD.size();i++){ km.getContent(listA, listB, listC, listD.get(i)); } } /** * 寫入數(shù)據(jù) */ private static void setDate() { //A的坐標(biāo)點 int A_x[]={1,1,2,2,1}; int A_y[]={0,1,1,0,2}; //B的坐標(biāo)點 int B_x[]={2,3,3,3,4}; int B_y[]={4,4,3,2,3}; //C的坐標(biāo)點 int C_x[]={4,5,5,6,6}; int C_y[]={1,2,0,2,1}; // 測試數(shù)據(jù) //B的坐標(biāo)點 int D_x[]={3,3,3,0,5}; int D_y[]={0,1,5,0,1}; // PointBean bA; for(int i=0;i<5;i++){ bA=new PointBean(A_x[i], A_y[i]); listA.add(bA); } // PointBean bB ; for(int i=0;i<5;i++){ bB=new PointBean(B_x[i], B_y[i]); listB.add(bB); } // PointBean bC ; for(int i=0;i<5;i++){ bC=new PointBean(C_x[i], C_y[i]); listC.add(bC); } // PointBean bD ; for(int i=0;i<5;i++){ bD=new PointBean(D_x[i], D_y[i]); listD.add(bD); } } }
測試的結(jié)果:
這個點:3 , 1 屬于A
這個點:3 , 5 屬于B
這個點:0 , 0 屬于A
這個點:5 , 1 屬于C
到此簡單的KNN算法已經(jīng)實現(xiàn)對于未知點的劃分,有助于大家對于KNN算法的理解。對于改進KNN的一些算法JAVA實現(xiàn)會在后面進行貼出。共同學(xué)習(xí)共同進步!
更多關(guān)于java算法相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Java數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Java操作DOM節(jié)點技巧總結(jié)》、《Java文件與目錄操作技巧匯總》和《Java緩存操作技巧匯總》
希望本文所述對大家java程序設(shè)計有所幫助。
相關(guān)文章
Java為什么基本數(shù)據(jù)類型不需要進行創(chuàng)建對象?
今天小編就為大家分享一篇關(guān)于Java為什么基本數(shù)據(jù)類型不需要進行創(chuàng)建對象?,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2019-04-04Java優(yōu)化for循環(huán)嵌套的高效率方法
這篇文章主要介紹了Java優(yōu)化for循環(huán)嵌套的高效率方法,幫助大家更好的提升java程序性能,感興趣的朋友可以了解下2020-09-09如何解決@PutMapping或@PostMapping接收String類型參數(shù)多兩個“引號問題
這篇文章主要介紹了如何解決@PutMapping或@PostMapping接收String類型參數(shù)多兩個“引號問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-08-08Java中的線程池ThreadPoolExecutor細致講解
這篇文章主要介紹了Java中的線程池ThreadPoolExecutor細致講解,線程池是一種基于池化思想管理線程的工具,經(jīng)常出現(xiàn)在多線程服務(wù)器中,如MySQL,線程過多會帶來額外的開銷,其中包括創(chuàng)建銷毀線程的開銷、調(diào)度線程的開銷等等,需要的朋友可以參考下2023-11-11