PHP字符串長(zhǎng)度計(jì)算 - strlen()函數(shù)使用介紹
更新時(shí)間:2013年10月15日 16:22:22 作者:
在PHP中,函數(shù)strlen()返回字符串的長(zhǎng)度,strlen()函數(shù)返回字符串所占的字節(jié)長(zhǎng)度,一個(gè)英文字母、數(shù)字、各種符號(hào)均占一個(gè)字節(jié),它們的長(zhǎng)度均為1
strlen()函數(shù)和mb_strlen()函數(shù)
在PHP中,函數(shù)strlen()返回字符串的長(zhǎng)度。函數(shù)原型如下:
int strlen(string string_input);
參數(shù)string_input為要處理的字符串。
strlen()函數(shù)返回字符串所占的字節(jié)長(zhǎng)度,一個(gè)英文字母、數(shù)字、各種符號(hào)均占一個(gè)字節(jié),它們的長(zhǎng)度均為1。一個(gè)中午字符占兩個(gè)字節(jié),所以一個(gè)中午字符的長(zhǎng)度是2。例如
<?php
echo strlen("www.sunchis.com");
echo strlen("三知開(kāi)發(fā)網(wǎng)");
?>
“echo strlen("www.sunchis.com");”的運(yùn)行結(jié)果:15
“echo strlen("三知開(kāi)發(fā)網(wǎng)");”的運(yùn)行結(jié)果:15
這里有一個(gè)疑問(wèn),一個(gè)中文字符不是占2個(gè)字節(jié)嗎?“三知開(kāi)發(fā)網(wǎng)”,明明是五個(gè)漢字,運(yùn)行的結(jié)果怎么會(huì)是15?
原因出在這里:strlen()計(jì)算時(shí),對(duì)于一個(gè)UTF-8的中文字符,會(huì)把它當(dāng)做長(zhǎng)度為3來(lái)處理。當(dāng)出現(xiàn)中英文混排的情況下,怎么準(zhǔn)確的計(jì)算字符串的長(zhǎng)度呢?這里,得引入另外一個(gè)函數(shù)mb_strlen()。mb_strlen()函數(shù)的用法與strlen()幾乎一摸一樣,只是多了一個(gè)指定字符集編碼的參數(shù)。函數(shù)原型為:
int mb_strlen(string string_input, string encode);
PHP內(nèi)置的字符串長(zhǎng)度函數(shù)strlen無(wú)法正確處理中文字符串,它得到的只是字符串所占的字節(jié)數(shù)。對(duì)于GB2312的中文編碼,strlen得到的值是漢字個(gè)數(shù)的2倍,而對(duì)于UTF-8編碼的中文,就是3倍的差異了(在UTF-8編碼下,一個(gè)漢字占3個(gè)字節(jié))。 因此,下面的代碼能準(zhǔn)確計(jì)算出中文字符串的長(zhǎng)度:
<?php
$str = "三知sunchis開(kāi)發(fā)網(wǎng)";
echo strlen($str)."<br>"; //結(jié)果:22
echo mb_strlen($str,"UTF8")."<br>"; //結(jié)果:12
$strlen = (strlen($str)+mb_strlen($str,"UTF8"))/2;
echo $strlen; //結(jié)果:17
?>
原理分析:
strlen()計(jì)算時(shí),對(duì)待UTF-8的中文字符長(zhǎng)度是3,所以“三知sunchis開(kāi)發(fā)網(wǎng)”的長(zhǎng)度為5×3+7×1=22
在mb_strlen計(jì)算時(shí),選定內(nèi)碼為UTF8,則會(huì)將一個(gè)中文字符當(dāng)作長(zhǎng)度1來(lái)計(jì)算,所以“三知sunchis開(kāi)發(fā)網(wǎng)”長(zhǎng)度為5×1+7×1=12
剩下的就是純數(shù)學(xué)問(wèn)題了,在此就不啰嗦了……
注意:對(duì)于mb_strlen($str,'UTF-8'),如果省略第二個(gè)參數(shù),則會(huì)使用PHP的內(nèi)部編碼。內(nèi)部編碼可以通過(guò)mb_internal_encoding()函數(shù)得到。需要注意的是,mb_strlen并不是PHP核心函數(shù),使用前需要確保在php.ini中加載了php_mbstring.dll,即確保“extension=php_mbstring.dll”這一行存在并且沒(méi)有被注釋掉,否則會(huì)出現(xiàn)未定義函數(shù)的問(wèn)題。
在PHP中,函數(shù)strlen()返回字符串的長(zhǎng)度。函數(shù)原型如下:
復(fù)制代碼 代碼如下:
int strlen(string string_input);
參數(shù)string_input為要處理的字符串。
strlen()函數(shù)返回字符串所占的字節(jié)長(zhǎng)度,一個(gè)英文字母、數(shù)字、各種符號(hào)均占一個(gè)字節(jié),它們的長(zhǎng)度均為1。一個(gè)中午字符占兩個(gè)字節(jié),所以一個(gè)中午字符的長(zhǎng)度是2。例如
復(fù)制代碼 代碼如下:
<?php
echo strlen("www.sunchis.com");
echo strlen("三知開(kāi)發(fā)網(wǎng)");
?>
“echo strlen("www.sunchis.com");”的運(yùn)行結(jié)果:15
“echo strlen("三知開(kāi)發(fā)網(wǎng)");”的運(yùn)行結(jié)果:15
這里有一個(gè)疑問(wèn),一個(gè)中文字符不是占2個(gè)字節(jié)嗎?“三知開(kāi)發(fā)網(wǎng)”,明明是五個(gè)漢字,運(yùn)行的結(jié)果怎么會(huì)是15?
原因出在這里:strlen()計(jì)算時(shí),對(duì)于一個(gè)UTF-8的中文字符,會(huì)把它當(dāng)做長(zhǎng)度為3來(lái)處理。當(dāng)出現(xiàn)中英文混排的情況下,怎么準(zhǔn)確的計(jì)算字符串的長(zhǎng)度呢?這里,得引入另外一個(gè)函數(shù)mb_strlen()。mb_strlen()函數(shù)的用法與strlen()幾乎一摸一樣,只是多了一個(gè)指定字符集編碼的參數(shù)。函數(shù)原型為:
復(fù)制代碼 代碼如下:
int mb_strlen(string string_input, string encode);
PHP內(nèi)置的字符串長(zhǎng)度函數(shù)strlen無(wú)法正確處理中文字符串,它得到的只是字符串所占的字節(jié)數(shù)。對(duì)于GB2312的中文編碼,strlen得到的值是漢字個(gè)數(shù)的2倍,而對(duì)于UTF-8編碼的中文,就是3倍的差異了(在UTF-8編碼下,一個(gè)漢字占3個(gè)字節(jié))。 因此,下面的代碼能準(zhǔn)確計(jì)算出中文字符串的長(zhǎng)度:
復(fù)制代碼 代碼如下:
<?php
$str = "三知sunchis開(kāi)發(fā)網(wǎng)";
echo strlen($str)."<br>"; //結(jié)果:22
echo mb_strlen($str,"UTF8")."<br>"; //結(jié)果:12
$strlen = (strlen($str)+mb_strlen($str,"UTF8"))/2;
echo $strlen; //結(jié)果:17
?>
原理分析:
strlen()計(jì)算時(shí),對(duì)待UTF-8的中文字符長(zhǎng)度是3,所以“三知sunchis開(kāi)發(fā)網(wǎng)”的長(zhǎng)度為5×3+7×1=22
在mb_strlen計(jì)算時(shí),選定內(nèi)碼為UTF8,則會(huì)將一個(gè)中文字符當(dāng)作長(zhǎng)度1來(lái)計(jì)算,所以“三知sunchis開(kāi)發(fā)網(wǎng)”長(zhǎng)度為5×1+7×1=12
剩下的就是純數(shù)學(xué)問(wèn)題了,在此就不啰嗦了……
注意:對(duì)于mb_strlen($str,'UTF-8'),如果省略第二個(gè)參數(shù),則會(huì)使用PHP的內(nèi)部編碼。內(nèi)部編碼可以通過(guò)mb_internal_encoding()函數(shù)得到。需要注意的是,mb_strlen并不是PHP核心函數(shù),使用前需要確保在php.ini中加載了php_mbstring.dll,即確保“extension=php_mbstring.dll”這一行存在并且沒(méi)有被注釋掉,否則會(huì)出現(xiàn)未定義函數(shù)的問(wèn)題。
相關(guān)文章
在PHP中使用反射技術(shù)的架構(gòu)插件使用說(shuō)明
基于反射的插件架構(gòu)實(shí)際上并沒(méi)有歸類為一種模式,因?yàn)樗鼘?shí)際上不是一個(gè)模板,而是一糸列組合在一起的形成程序架構(gòu)的概念。2010-05-05php實(shí)現(xiàn)獲取農(nóng)歷(陰歷)、節(jié)日、節(jié)氣的類與用法示例
這篇文章主要介紹了php實(shí)現(xiàn)獲取農(nóng)歷(陰歷)、節(jié)日、節(jié)氣的類與用法,結(jié)合實(shí)例形式分析了php日期工具類Lunar的具體定義與獲取農(nóng)歷日期、節(jié)氣等相關(guān)操作技巧,需要的朋友可以參考下2017-11-11PHP 遠(yuǎn)程文件管理,可以給表格排序,遍歷目錄,時(shí)間排序
PHP 遠(yuǎn)程文件管理,可以給表格排序,遍歷目錄,時(shí)間排序 點(diǎn)擊表格第一行,頭部就可以排序了,這個(gè)列子是當(dāng)前目錄的2009-08-08ASP和PHP實(shí)現(xiàn)生成網(wǎng)站快捷方式并下載到桌面的方法
這篇文章主要介紹了PHP實(shí)現(xiàn)生成網(wǎng)站快捷方式并下載到桌面的方法,比加入收藏、設(shè)為首頁(yè)更給力哦,需要的朋友可以參考下2014-05-05php使用PhpSpreadsheet導(dǎo)出Excel表格的實(shí)例詳解
這篇文章將給大家介紹php使用PhpSpreadsheet導(dǎo)出Excel表格的實(shí)例,文中通過(guò)代碼示例給大家講解的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作有一定的幫助,需要的朋友可以參考下2024-01-01PHP面向?qū)ο蟪绦蛟O(shè)計(jì)子類擴(kuò)展父類(子類重新載入父類)操作詳解
這篇文章主要介紹了PHP面向?qū)ο蟪绦蛟O(shè)計(jì)子類擴(kuò)展父類(子類重新載入父類)操作,涉及php面向?qū)ο蠓椒ㄖ貙?xiě)與擴(kuò)展相關(guān)操作技巧,需要的朋友可以參考下2019-06-06