java全角與半角標(biāo)點符號相互轉(zhuǎn)換詳解
引言
早上發(fā)現(xiàn)某個群居然爆出一個bug,上游系統(tǒng)存儲的客戶簡稱是商務(wù)人員自己填的,這個字段支持用戶錄入各種字符。但是下游對接的其他系統(tǒng),在將這個字段應(yīng)用到系統(tǒng)中的時候,不能支持全角的標(biāo)點符號,如果這個字段有全角標(biāo)點符號,則系統(tǒng)會出錯。
看到這個問題,我首先覺得下游對接的系統(tǒng)也是奇葩,居然還不支持全角的字符串。但是一想到我們沒辦法強迫下游系統(tǒng)來改變他們的接口,而站在本系統(tǒng)的角度來考慮,未來下游系統(tǒng)還很多,畢竟客戶的基本信息數(shù)據(jù)會應(yīng)用到越來越多的系統(tǒng)中去。最好的方式就是我們將采集到的客戶信息中的全角字符,都自動轉(zhuǎn)為半角字符。將客戶信息的接口加以約束,這樣能一勞永逸。
什么是全角,什么是半角
說到全角和半角的標(biāo)點符號問題,這里就需要介紹一下什么是全角,什么是半角。
全角:指一個字符占用兩個標(biāo)準(zhǔn)字符位置。 漢字字符和規(guī)定了全角的英文字符及國標(biāo)GB2312-80中的圖形符號和特殊字符都是全角字符。一般的系統(tǒng)命令是非全角字符的,只有在文本處理時才會使用全角字符。
半角:指一字符占用一個標(biāo)準(zhǔn)的字符位置。 通常的英文字母、數(shù)字鍵、符號鍵都是半角的,半角的顯示內(nèi)碼都是一個字節(jié)。在系統(tǒng)內(nèi)部,以上三種字符是作為基本代碼處理的,所以用戶輸入命令和參數(shù)時一般都使用半角。
全角與半角的使用場景 通常情況下,我們認為全角是占兩個字節(jié),而半角只占一個字節(jié),但是需要注意的是,這都是相對標(biāo)點符號而言。因為漢字不管全角還是半角,都是兩個字節(jié)。而我們的所有程序代碼中,都只支持半角字符,全角字符默認會當(dāng)作文本。
全角字符和半角字符的范圍
經(jīng)過觀察,我們可以得到如下結(jié)論:
- 1.半角字符是從33開始到126結(jié)束
- 2.與半角字符對應(yīng)的全角字符是從65281開始到65374結(jié)束
- 3.其中半角的空格是32.對應(yīng)的全角空格是12288
- 4.半角和全角的關(guān)系很明顯,除空格外的字符偏移量是65248(65281-33 = 65248)
這樣我們可以做一個工具類來進行全角和半角字符的轉(zhuǎn)換,針對本文開篇的問題,就可以很方便的解決:
package com.dhb.springbootdata; public class AsciiUtil { public static final char SBC_SPACE = 12288; // 全角空格 12288 public static final char DBC_SPACE = 32; //半角空格 32 // ASCII character 33-126 <-> unicode 65281-65374 public static final char ASCII_START = 33; public static final char ASCII_END = 126; public static final char UNICODE_START = 65281; public static final char UNICODE_END = 65374; public static final char DBC_SBC_STEP = 65248; // 全角半角轉(zhuǎn)換間隔 public static char sbc2dbc(char src) { if (src == SBC_SPACE) { return DBC_SPACE; } if (src >= UNICODE_START && src <= UNICODE_END) { return (char) (src - DBC_SBC_STEP); } return src; } /** * Convert from SBC case to DBC case * * @param src * @return DBC case */ public static String sbc2dbcCase(String src) { if (src == null) { return null; } char[] c = src.toCharArray(); for (int i = 0; i < c.length; i++) { c[i] = sbc2dbc(c[i]); } return new String(c); } public static char dbc2sbc(char src) { if (src == DBC_SPACE) { return SBC_SPACE; } if (src <= ASCII_END) { return (char) (src + DBC_SBC_STEP); } return src; } /** * Convert from DBC case to SBC case. * * @param src * @return SBC case string */ public static String dbc2sbcCase(String src) { if (src == null) { return null; } char[] c = src.toCharArray(); for (int i = 0; i < c.length; i++) { c[i] = dbc2sbc(c[i]); } return new String(c); } public static void main(String[] args) { System.out.println(AsciiUtil.sbc2dbcCase("你好(張三)111?!")); System.out.println(AsciiUtil.dbc2sbcCase("你好(張三)111?!")); Character.MIN_VALUE } }
上述代碼執(zhí)行結(jié)果:
你好(張三)111?!
你好(張三)111?!
以上就是java全角與半角標(biāo)點符號相互轉(zhuǎn)換詳解的詳細內(nèi)容,更多關(guān)于java全角半角標(biāo)點符號轉(zhuǎn)換的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
JAVA正則表達式及字符串的替換與分解相關(guān)知識總結(jié)
今天給大家?guī)淼氖顷P(guān)于Java的相關(guān)知識總結(jié),文章圍繞著JAVA正則表達式及字符串的替換與分解展開,文中有非常詳細的介紹及代碼示例,需要的朋友可以參考下2021-06-06Java實現(xiàn)學(xué)生信息管理系統(tǒng)(使用數(shù)據(jù)庫)
這篇文章主要為大家詳細介紹了Java實現(xiàn)學(xué)生信息管理系統(tǒng),使用數(shù)據(jù)庫,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-01-01Springcloud中的Nacos?Config服務(wù)配置流程分析
這篇文章主要介紹了Springcloud中的Nacos?Config服務(wù)配置,本文以用戶微服務(wù)為例,進行統(tǒng)一的配置,結(jié)合實例代碼給大家介紹的非常詳細,需要的朋友可以參考下2022-09-09