亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

PHP?trim函數(shù)對多字節(jié)字符的使用限制實例探究

 更新時間:2024年01月12日 08:58:14   作者:沈唁  
這篇文章主要為大家介紹了PHP?trim函數(shù)對多字節(jié)字符的使用限制實例探究,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪

引言

先來判斷下這段代碼的輸出是否一致?

$string = '沈唁 ';
var_dump(trim($string));
var_dump(preg_replace('/^[\s\0]+|[\s\0]+$/u', '', $string));

如果你覺得是一致的,那么就是大錯特錯了。

在日常工作中,經(jīng)常需要處理字符串。其中一種常用的情況是,需要刪除字符串兩端的空白字符,這就是 trim() 函數(shù)原本的作用。

但是標準的 trim() 函數(shù)不能處理多字節(jié)字符。

什么是trim()函數(shù)?

在PHP中, trim() 函數(shù)用于刪除字符串的開頭和結(jié)尾的空白字符。默認情況下,這些字符包括:

  • "\0" - NULL
  • "\t" - 制表符
  • "\n" - 換行
  • "\v" - 垂直制表符
  • "\r" - 回車
  • " " - 空格

mbstring 擴展

在很多語言中,每個必要字符都能一對一映射到 8 bit 的值,但也有一些語言需要非常多的字符來書面通訊,以至于它們的編碼范圍不能僅僅包含在一個字節(jié)里。

開發(fā)多字節(jié)字符編碼方案是為了在基于字節(jié)的常規(guī)編碼系統(tǒng)中表達超過 256 個字符。

在使用trimsplit、splice 等等操作多字節(jié)編碼的字符串的時候,特別需要注意,由于在這種編碼方案下,兩個或多個連續(xù)字節(jié)可能只表達了一個字符,所以需要使用專門的函數(shù)。 否則,你可能會得到一個以亂碼的字符串結(jié)尾。

而 mbstring 提供了針對多字節(jié)字符串的函數(shù),能夠幫開發(fā)者處理 PHP 中的多字節(jié)編碼。

mbstring 擴展的使用和普通字符串操作函數(shù)一致,而且僅僅需要加上mb_前綴即可。

類似于:

  • split => mb_split
  • strlen => mb_strlen
  • substr => mb_substr

以此類推,trim 是不是可以直接改為調(diào)用mb_trim?

答案是也不是。因為你可能會得到一個錯誤:

PHP Fatal error:  Uncaught Error: Call to undefined function mb_trim()

mb_trim、mb_ltrim 和 mb_rtrim

從 2022 年 8 月份就有人在 php-src 的 issue 進行了反饋,這三個函數(shù)也是前不久剛剛通過 RFC,合并到 PHP 內(nèi)核中新增的。

https://github.com/php/php-src/commit/a80b6d7b99ae885cb450a563a788f57917cef74e

function mb_trim(string $string, string $characters = " \f\n\r\t\v\x00\u{00A0}\u{1680}\u{2000}\u{2001}\u{2002}\u{2003}\u{2004}\u{2005}\u{2006}\u{2007}\u{2008}\u{2009}\u{200A}\u{2028}\u{2029}\u{202F}\u{205F}\u{3000}\u{0085}\u{180E}"): string

function mb_ltrim(string $string, string $characters = " \f\n\r\t\v\x00\u{00A0}\u{1680}\u{2000}\u{2001}\u{2002}\u{2003}\u{2004}\u{2005}\u{2006}\u{2007}\u{2008}\u{2009}\u{200A}\u{2028}\u{2029}\u{202F}\u{205F}\u{3000}\u{0085}\u{180E}", ?string $encoding = null): string

function mb_rtrim(string $string, string $characters = " \f\n\r\t\v\x00\u{00A0}\u{1680}\u{2000}\u{2001}\u{2002}\u{2003}\u{2004}\u{2005}\u{2006}\u{2007}\u{2008}\u{2009}\u{200A}\u{2028}\u{2029}\u{202F}\u{205F}\u{3000}\u{0085}\u{180E}", ?string $encoding = null): string

所以雖然 8.3 剛發(fā)布,但是 8.3 中確實沒有這三個函數(shù),可能需要在 8.3.1 中才能使用了。

不過 PHP 足夠靈活,使我們能夠根據(jù)需要創(chuàng)建自定義的函數(shù),如多字節(jié) mb_trim() 函數(shù)。

if (!function_exists('mb_trim')) {
    function mb_trim($string)
    {
        return preg_replace('/^[\s\0]+|[\s\0]+$/u', '', $string);
    }
}

以上就是PHP trim函數(shù)對多字節(jié)字符的使用限制實例探究的詳細內(nèi)容,更多關(guān)于PHP trim限制多字節(jié)字符的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

最新評論