JAVA 統(tǒng)計字符串中中文,英文,數(shù)字,空格,特殊字符的個數(shù)
引言
可以根據(jù)各種字符在Unicode字符編碼表中的區(qū)間來進行判斷,如數(shù)字為'0'~'9'之間,英文字母為'a'~'z'或'A'~'Z'等,Java判斷一個字符串是否有中文是利用Unicode編碼來判斷,因為中文的編碼區(qū)間為:0x4e00--0x9fbb, 但通用區(qū)間來判斷中文也不非常精確,因為有些中文的標點符號利用區(qū)間判斷會得到錯誤的結(jié)果。所以通過Character.UnicodeBlock來進行判斷。代碼如下:
package cn.csrc.base.count; public class CountCharacter { public static void main(String[] args) { String str ="我愛你abcd123中國 #!"; CountCharacter countCharacter = new CountCharacter(); countCharacter.count(str); } /**中文字符 */ private int chCharacter = 0; /**英文字符 */ private int enCharacter = 0; /**空格 */ private int spaceCharacter = 0; /**數(shù)字 */ private int numberCharacter = 0; /**其他字符 */ private int otherCharacter = 0; //記錄中文字符 private StringBuilder sb1=new StringBuilder(); //記錄英文字符 private StringBuilder sb2=new StringBuilder(); //記錄數(shù)字 private StringBuilder sb3=new StringBuilder(); //記錄特殊字符 private StringBuilder sb4=new StringBuilder(); /*** * 統(tǒng)計字符串中中文,英文,數(shù)字,空格等字符個數(shù) * @param str 需要統(tǒng)計的字符串 */ public void count(String str) { if(str.equals("") || str==null){ System.out.println("字符串為空"); return; } for (int i = 0; i < str.length(); i++) { char tmp = str.charAt(i); if ((tmp >= 'A' && tmp <= 'Z') || (tmp >= 'a' && tmp <= 'z')) { enCharacter ++; sb2.append(tmp+" "); } else if ((tmp >= '0') && (tmp <= '9')) { numberCharacter ++; sb3.append(tmp +" "); } else if (tmp ==' ') { spaceCharacter ++; } else if (isChinese(tmp)) { chCharacter ++; sb1.append(tmp+" "); } else { otherCharacter ++; sb4.append(tmp +" "); } } System.out.println("字符串:" + str + " \r\n"); System.out.println("中文字符有:" + chCharacter +"個 ("+sb1.toString()+")"); System.out.println("英文字符有:" + enCharacter +"個 ("+sb2.toString()+")"); System.out.println("數(shù)字有:" + numberCharacter+"個 ("+sb3.toString()+")"); System.out.println("空格有:" + spaceCharacter+"個"); System.out.println("其他字符有:" + otherCharacter+"個 ("+sb4.toString()+")"); } /*** * 判斷字符是否為中文 * @param ch 需要判斷的字符 * @return 中文返回true,非中文返回false */ private boolean isChinese(char ch) { //獲取此字符的UniCodeBlock Character.UnicodeBlock ub = Character.UnicodeBlock.of(ch); // GENERAL_PUNCTUATION 判斷中文的“號 // CJK_SYMBOLS_AND_PUNCTUATION 判斷中文的。號 if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOG RAPHS_EXTENSION_B || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) { System.out.println(ch + " 是中文"); //sb1.append(ch+" "); return true; } return false; } }
結(jié)果如下:
總結(jié)
以上所述是小編給大家介紹的JAVA 統(tǒng)計字符串中中文,英文,數(shù)字,空格,特殊字符的個數(shù),希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!
相關(guān)文章
使用Mybatis對數(shù)據(jù)庫進行單表操作的實現(xiàn)示例
這篇文章主要介紹了使用Mybatis對數(shù)據(jù)庫進行單表操作的實現(xiàn)示例,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08Spring的@CrossOrigin注解使用與CrossFilter對象自定義詳解
這篇文章主要介紹了Spring的@CrossOrigin注解使用與CrossFilter對象自定義詳解,跨域,指的是瀏覽器不能執(zhí)行其他網(wǎng)站的腳本,它是由瀏覽器的同源策略造成的,是瀏覽器施加的安全限制,所謂同源是指,域名,協(xié)議,端口均相同,需要的朋友可以參考下2023-12-12詳解用JWT對SpringCloud進行認證和鑒權(quán)
這篇文章主要介紹了詳解用JWT對SpringCloud進行認證和鑒權(quán),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-03-03Java實現(xiàn)線程安全單例模式的五種方式的示例代碼
這篇文章主要介紹了Java中實現(xiàn)線程安全單例模式的五種方式:餓漢式、枚舉單例、懶漢式、DCL懶漢式和靜態(tài)內(nèi)部類懶漢單例,感興趣的可以了解一下2022-03-03