用JavaScript計(jì)算在UTF-8下存儲(chǔ)字符串占用字節(jié)數(shù)
更新時(shí)間:2013年08月08日 16:01:23 作者:
想辦法在JavaScript中判斷在UTF-8下存儲(chǔ)的String的字節(jié)數(shù),在網(wǎng)上找到很多關(guān)于Unicode介紹的文檔,最重要的是字符編碼數(shù)值對(duì)應(yīng)的存儲(chǔ)長(zhǎng)度
最近和JavaScript糾纏上了。
遇到這么一個(gè)問題,數(shù)據(jù)庫(kù)的字符集為UTF-8的,要在頁(yè)面上使用JavaScript驗(yàn)證輸入的文本用UTF-8存儲(chǔ)時(shí)占用字節(jié)長(zhǎng)度。JavaScript的String對(duì)象有l(wèi)ength屬性,但是這個(gè)計(jì)算的是字符數(shù),不是字節(jié)數(shù)(問題總是翻來(lái)覆去的,記得當(dāng)年玩Delphi的時(shí)候,還得寫程序計(jì)算字符串的字符數(shù),因?yàn)镈elphi中String的length是字節(jié)數(shù)...)。偷懶一點(diǎn)的辦法是將驗(yàn)證代碼中最大長(zhǎng)度設(shè)置為數(shù)據(jù)庫(kù)中對(duì)應(yīng)字段的長(zhǎng)度的1/3,但是這樣準(zhǔn)確來(lái)說有點(diǎn)不合適。
所以想辦法在JavaScript中判斷在UTF-8下存儲(chǔ)的String的字節(jié)數(shù),在網(wǎng)上找到很多關(guān)于Unicode介紹的文檔,最重要的是字符編碼數(shù)值對(duì)應(yīng)的存儲(chǔ)長(zhǎng)度:
UCS-2編碼(16進(jìn)制) UTF-8 字節(jié)流(二進(jìn)制)
0000 - 007F 0xxxxxxx (1字節(jié))
0080 - 07FF 110xxxxx 10xxxxxx (2字節(jié))
0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx (3字節(jié))
于是代碼如下:
[
function mbStringLength(s) {
var totalLength = 0;
var i;
var charCode;
for (i = 0; i < s.length; i++) {
charCode = s.charCodeAt(i);
if (charCode < 0x007f) {
totalLength = totalLength + 1;
} else if ((0x0080 <= charCode) && (charCode <= 0x07ff)) {
totalLength += 2;
} else if ((0x0800 <= charCode) && (charCode <= 0xffff)) {
totalLength += 3;
}
}
//alert(totalLength);
return totalLength;
}
實(shí)際上,0x0080到0x07ff之間的字符很少會(huì)在實(shí)際用戶輸入中用到。
遇到這么一個(gè)問題,數(shù)據(jù)庫(kù)的字符集為UTF-8的,要在頁(yè)面上使用JavaScript驗(yàn)證輸入的文本用UTF-8存儲(chǔ)時(shí)占用字節(jié)長(zhǎng)度。JavaScript的String對(duì)象有l(wèi)ength屬性,但是這個(gè)計(jì)算的是字符數(shù),不是字節(jié)數(shù)(問題總是翻來(lái)覆去的,記得當(dāng)年玩Delphi的時(shí)候,還得寫程序計(jì)算字符串的字符數(shù),因?yàn)镈elphi中String的length是字節(jié)數(shù)...)。偷懶一點(diǎn)的辦法是將驗(yàn)證代碼中最大長(zhǎng)度設(shè)置為數(shù)據(jù)庫(kù)中對(duì)應(yīng)字段的長(zhǎng)度的1/3,但是這樣準(zhǔn)確來(lái)說有點(diǎn)不合適。
所以想辦法在JavaScript中判斷在UTF-8下存儲(chǔ)的String的字節(jié)數(shù),在網(wǎng)上找到很多關(guān)于Unicode介紹的文檔,最重要的是字符編碼數(shù)值對(duì)應(yīng)的存儲(chǔ)長(zhǎng)度:
UCS-2編碼(16進(jìn)制) UTF-8 字節(jié)流(二進(jìn)制)
0000 - 007F 0xxxxxxx (1字節(jié))
0080 - 07FF 110xxxxx 10xxxxxx (2字節(jié))
0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx (3字節(jié))
于是代碼如下:
[
復(fù)制代碼 代碼如下:
function mbStringLength(s) {
var totalLength = 0;
var i;
var charCode;
for (i = 0; i < s.length; i++) {
charCode = s.charCodeAt(i);
if (charCode < 0x007f) {
totalLength = totalLength + 1;
} else if ((0x0080 <= charCode) && (charCode <= 0x07ff)) {
totalLength += 2;
} else if ((0x0800 <= charCode) && (charCode <= 0xffff)) {
totalLength += 3;
}
}
//alert(totalLength);
return totalLength;
}
實(shí)際上,0x0080到0x07ff之間的字符很少會(huì)在實(shí)際用戶輸入中用到。
相關(guān)文章
基于原生js運(yùn)動(dòng)方式關(guān)鍵點(diǎn)的總結(jié)(推薦)
下面小編就為大家?guī)?lái)一篇基于原生js運(yùn)動(dòng)方式關(guān)鍵點(diǎn)的總結(jié)(推薦)。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來(lái)看看吧2017-10-10ThreeJS從創(chuàng)建場(chǎng)景到使用功能實(shí)例詳解
threejs是一個(gè)用于在瀏覽器中繪制3D圖像的JS庫(kù),它是基于webgl實(shí)現(xiàn)了,包括了webgl1和webgl2的渲染引擎,下面這篇文章主要給大家介紹了關(guān)于ThreeJS從創(chuàng)建場(chǎng)景到使用功能的相關(guān)資料,需要的朋友可以參考下2022-08-08簡(jiǎn)單的網(wǎng)頁(yè)廣告特效實(shí)例
下面小編就為大家?guī)?lái)一篇簡(jiǎn)單的網(wǎng)頁(yè)廣告特效實(shí)例。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來(lái)看看吧2017-08-08javascript設(shè)計(jì)模式 – 策略模式原理與用法實(shí)例分析
這篇文章主要介紹了javascript設(shè)計(jì)模式 – 策略模式,結(jié)合實(shí)例形式分析了javascript策略模式相關(guān)概念、原理、用法及操作注意事項(xiàng),需要的朋友可以參考下2020-04-04