Java 判斷字符為中文實例代碼(超管用)
在做項目中經(jīng)常會遇到有項目需求是需要判斷字符為中文的一些問題,所以搜集了判斷中文字符的代碼片段,特此分享供大家參考。
直接貼出代碼了,里面有詳細(xì)的注釋。
package com.coder4j.main; import java.util.regex.Pattern; /** * Java 判斷中文字符 * * @author Chinaxiang * @date 2015-08-11 * */ public class CheckChinese { public static void main(String[] args) { // 純英文 String s1 = "Hello,Tom.!@#$%^&*()_+-={}|[];':\"?"; // 純中文(不含中文標(biāo)點) String s2 = "你好中國"; // 純中文(含中文標(biāo)點) String s3 = "你好,中國?!丁罚骸啊薄?;()【】?。ぁ?; // 韓文 String s4 = "한국어난"; // 日文 String s5 = "ぎじゅつ"; // 特殊字符 String s6 = "��"; String s7 = "╃"; String s8 = "╂"; // 繁體中文 String s9 = "蒼老師"; // 1 使用字符范圍判斷 System.out.println("s1是否包含中文:" + hasChineseByRange(s1));// false System.out.println("s2是否包含中文:" + hasChineseByRange(s2));// true System.out.println("s3是否包含中文:" + hasChineseByRange(s3));// true System.out.println("s4是否包含中文:" + hasChineseByRange(s4));// false System.out.println("s5是否包含中文:" + hasChineseByRange(s5));// false System.out.println("s6是否包含中文:" + hasChineseByRange(s6));// false System.out.println("s7是否包含中文:" + hasChineseByRange(s7));// false System.out.println("s8是否包含中文:" + hasChineseByRange(s8));// false System.out.println("s9是否包含中文:" + hasChineseByRange(s9));// true System.out.println("-------分割線-------"); System.out.println("s1是否全是中文:" + isChineseByRange(s1));// false System.out.println("s2是否全是中文:" + isChineseByRange(s2));// true System.out.println("s3是否全是中文:" + isChineseByRange(s3));// false 中文標(biāo)點不在范圍內(nèi) System.out.println("s4是否全是中文:" + isChineseByRange(s4));// false System.out.println("s5是否全是中文:" + isChineseByRange(s5));// false System.out.println("s6是否全是中文:" + isChineseByRange(s6));// false System.out.println("s7是否全是中文:" + isChineseByRange(s7));// false System.out.println("s8是否全是中文:" + isChineseByRange(s8));// false System.out.println("s9是否全是中文:" + isChineseByRange(s9));// true System.out.println("-------分割線-------"); // 2 使用字符范圍正則判斷(結(jié)果同1) System.out.println("s1是否包含中文:" + hasChineseByReg(s1));// false System.out.println("s2是否包含中文:" + hasChineseByReg(s2));// true System.out.println("s3是否包含中文:" + hasChineseByReg(s3));// true System.out.println("s4是否包含中文:" + hasChineseByReg(s4));// false System.out.println("s5是否包含中文:" + hasChineseByReg(s5));// false System.out.println("s6是否包含中文:" + hasChineseByReg(s6));// false System.out.println("s7是否包含中文:" + hasChineseByReg(s7));// false System.out.println("s8是否包含中文:" + hasChineseByReg(s8));// false System.out.println("s9是否包含中文:" + hasChineseByReg(s9));// true System.out.println("-------分割線-------"); System.out.println("s1是否全是中文:" + isChineseByReg(s1));// false System.out.println("s2是否全是中文:" + isChineseByReg(s2));// true System.out.println("s3是否全是中文:" + isChineseByReg(s3));// false 中文標(biāo)點不在范圍內(nèi) System.out.println("s4是否全是中文:" + isChineseByReg(s4));// false System.out.println("s5是否全是中文:" + isChineseByReg(s5));// false System.out.println("s6是否全是中文:" + isChineseByReg(s6));// false System.out.println("s7是否全是中文:" + isChineseByReg(s7));// false System.out.println("s8是否全是中文:" + isChineseByReg(s8));// false System.out.println("s9是否全是中文:" + isChineseByReg(s9));// true System.out.println("-------分割線-------"); // 3 使用CJK字符集判斷 System.out.println("s1是否包含中文:" + hasChinese(s1));// false System.out.println("s2是否包含中文:" + hasChinese(s2));// true System.out.println("s3是否包含中文:" + hasChinese(s3));// true System.out.println("s4是否包含中文:" + hasChinese(s4));// false System.out.println("s5是否包含中文:" + hasChinese(s5));// false System.out.println("s6是否包含中文:" + hasChinese(s6));// false System.out.println("s7是否包含中文:" + hasChinese(s7));// false System.out.println("s8是否包含中文:" + hasChinese(s8));// false System.out.println("s9是否包含中文:" + hasChinese(s9));// true System.out.println("-------分割線-------"); System.out.println("s1是否全是中文:" + isChinese(s1));// false System.out.println("s2是否全是中文:" + isChinese(s2));// true System.out.println("s3是否全是中文:" + isChinese(s3));// true 中文標(biāo)點也被包含進(jìn)來 System.out.println("s4是否全是中文:" + isChinese(s4));// false System.out.println("s5是否全是中文:" + isChinese(s5));// false System.out.println("s6是否全是中文:" + isChinese(s6));// false System.out.println("s7是否全是中文:" + isChinese(s7));// false System.out.println("s8是否全是中文:" + isChinese(s8));// false System.out.println("s9是否全是中文:" + isChinese(s9));// true } /** * 是否包含中文字符<br> * 包含中文標(biāo)點符號<br> * * @param str * @return */ public static boolean hasChinese(String str) { if (str == null) { return false; } char[] ch = str.toCharArray(); for (char c : ch) { if (isChinese(c)) { return true; } } return false; } /** * 是否全是中文字符<br> * 包含中文標(biāo)點符號<br> * * @param str * @return */ public static boolean isChinese(String str) { if (str == null) { return false; } char[] ch = str.toCharArray(); for (char c : ch) { if (!isChinese(c)) { return false; } } return true; } /** * 是否是中文字符<br> * 包含中文標(biāo)點符號<br> * * @param c * @return */ private static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS) { return true; } else if (ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS) { return true; } else if (ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION) { return true; } else if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A) { return true; } else if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B) { return true; } else if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_C) { return true; } else if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_D) { return true; } else if (ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) { return true; } else if (ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) { return true; } return false; } /** * 是否包含漢字<br> * 根據(jù)漢字編碼范圍進(jìn)行判斷<br> * CJK統(tǒng)一漢字(不包含中文的,?!丁罚ǎ啊?”、?。さ确枺?lt;br> * * @param str * @return */ public static boolean hasChineseByReg(String str) { if (str == null) { return false; } Pattern pattern = Pattern.compile("[\\u4E00-\\u9FBF]+"); return pattern.matcher(str).find(); } /** * 是否全是漢字<br> * 根據(jù)漢字編碼范圍進(jìn)行判斷<br> * CJK統(tǒng)一漢字(不包含中文的,?!丁罚ǎ啊?”、?。さ确枺?lt;br> * * @param str * @return */ public static boolean isChineseByReg(String str) { if (str == null) { return false; } Pattern pattern = Pattern.compile("[\\u4E00-\\u9FBF]+"); return pattern.matcher(str).matches(); } /** * 是否包含漢字<br> * 根據(jù)漢字編碼范圍進(jìn)行判斷<br> * CJK統(tǒng)一漢字(不包含中文的,?!丁罚ǎ啊?”、!¥等符號)<br> * * @param str * @return */ public static boolean hasChineseByRange(String str) { if (str == null) { return false; } char[] ch = str.toCharArray(); for (char c : ch) { if (c >= 0x4E00 && c <= 0x9FBF) { return true; } } return false; } /** * 是否全是漢字<br> * 根據(jù)漢字編碼范圍進(jìn)行判斷<br> * CJK統(tǒng)一漢字(不包含中文的,?!丁罚ǎ啊?”、?。さ确枺?lt;br> * * @param str * @return */ public static boolean isChineseByRange(String str) { if (str == null) { return false; } char[] ch = str.toCharArray(); for (char c : ch) { if (c < 0x4E00 || c > 0x9FBF) { return false; } } return true; } }
如果僅僅去判斷是否是中文,不需判斷中文標(biāo)點的話,推薦使用正則去匹配,可能更高效點。
以上代碼內(nèi)容給大家介紹了Java 判斷字符為中文實例代碼(超管用),希望對大家有所幫助。
相關(guān)文章
WebClient拋UnsupportedMediaTypeException異常解決
這篇文章主要為大家介紹了WebClient拋UnsupportedMediaTypeException異常的解決方案,文中給大家介紹了六中方案,有需要的朋友可以借鑒參考下,希望能夠有所幫助2022-02-02Java如何將若干時間區(qū)間進(jìn)行合并的方法步驟
這篇文章主要介紹了Java如何將若干時間區(qū)間進(jìn)行合并的方法步驟,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-02-02Springboot結(jié)合Flowable實現(xiàn)工作流開發(fā)
本文主要介紹了Springboot結(jié)合Flowable實現(xiàn)工作流開發(fā),文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-01-01springboot如何獲取application.yml里值的方法
這篇文章主要介紹了springboot如何獲取application.yml里的值,文章圍繞主題相關(guān)自資料展開詳細(xì)的內(nèi)容介紹,具有一定的參考價值,需要的小伙伴可以參考一下2022-04-04