PHP學習筆記之字符串編碼的轉換和判斷
更新時間:2014年05月22日 10:47:15 作者:
GBK 和 UTF-8 編碼的轉換是一個非常惡心的事情,比如像 PHP 中的 json_encode 本身根本不支持 GBK 形式的編碼。有兩個庫函數(shù)能夠支持編碼的轉換,通常能夠想到的就是 iconv 函數(shù),使用起來也非常爽:
復制代碼 代碼如下:
iconv('GBK', 'UTF-8//IGNORE', '腳本之家'); // 將字符串由 GBK 編碼轉換為 UTF-8 編碼
但 iconv 只能解決編碼預先知道的情況,如果字符串編碼未知,則需要先探測其編碼,這時可能會用到 mb_string 擴展庫:
復制代碼 代碼如下:
mb_detect_encoding('腳本之家');
可是 mb_detect_encoding 存在一個硬傷,經常出現(xiàn)判斷不準確的情況?;蛟S這樣就可以解決:
復制代碼 代碼如下:
// 使用 iconv 轉換并判斷是否等值,效率不高
function is_utf8 ($str) {
if ($str === iconv('UTF-8', 'UTF-8//IGNORE', $str)) {
return 'UTF-8';
}
}
// 多種編碼的情況
function detect_encoding ($str) {
foreach (array('GBK', 'UTF-8') as $v) {
if ($str === iconv($v, $v . '//IGNORE', $str)) {
return $v;
}
}
}
通過以上方式得到字符串編碼信息后,就可以利用 iconv 或 mb_convert_encoding 來轉換編碼了。
相關文章
php中mail函數(shù)發(fā)送郵件失敗的解決方法
這篇文章主要介紹了php中mail函數(shù)發(fā)送郵件失敗的解決方法,涉及針對Linux運行平臺相關組件的配置技巧,具有一定的參考借鑒價值,需要的朋友可以參考下2014-12-12