文本文件編碼方式區(qū)別
更新時間:2008年09月11日 20:10:48 作者:
當一個軟件打開一個文本時,它要做的第一件事是決定這個文本究竟是使用哪種字符集的哪種編碼保存的。
軟件一般采用三種方式來決定文本的字符集和編碼:
檢測文件頭標識,提示用戶選擇,根據(jù)一定的規(guī)則猜測
最標準的途徑是檢測文本最開頭的幾個字節(jié),開頭字節(jié)Charset/encoding,如下表:
EF BB BF UTF-8
FE FF UTF-16/UCS-2, little endian
FF FE UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.
檢測文件頭標識,提示用戶選擇,根據(jù)一定的規(guī)則猜測
最標準的途徑是檢測文本最開頭的幾個字節(jié),開頭字節(jié)Charset/encoding,如下表:
EF BB BF UTF-8
FE FF UTF-16/UCS-2, little endian
FF FE UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.
相關文章
vscode使用editorconfig插件以及.editorconfig配置文件說明詳解
這篇文章主要介紹了vscode使用editorconfig插件以及.editorconfig配置文件說明詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-04-04

