亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

一文弄懂字符集編碼

 更新時(shí)間:2023年07月20日 11:11:17   作者:普通網(wǎng)友  
軟件開發(fā)人員經(jīng)常遇到中文亂碼、軟件不能顯示中文等類似問題,本文主要介紹了一文弄懂字符集編碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

軟件開發(fā)人員經(jīng)常遇到“中文亂碼”、“軟件不能顯示日文”等類似問題。真相只有一個(gè)——對(duì)字符集編碼沒有一個(gè)系統(tǒng)的認(rèn)知。

常見字符集編碼有GB2312、GBK、BIG5、UTF-8、UTF-16,甚至有些從事MFC開發(fā)的人可能還會(huì)說字符集有ANSI和UNICODE。真的是這樣嗎?直接上干貨。

字符集分類

1. ANSI

American National Standards Institute 美國(guó)國(guó)家標(biāo)準(zhǔn)學(xué)會(huì),由這個(gè)標(biāo)準(zhǔn)學(xué)會(huì)制訂的一種編碼規(guī)則。

  • 采用多字節(jié)系統(tǒng) (MBCS) 的變長(zhǎng)編碼,每個(gè)字符可以是單個(gè)字節(jié)、雙字節(jié),也可以是多字節(jié)的;
  • 兼容單字節(jié)字符集 (SBCS) 和雙字節(jié)字符集 (DBCS);
  • 兼容 EUC/EUC-CN 雙字節(jié)編碼。由于兼容了這個(gè)編碼,那么 ANSI 的雙字節(jié)編碼也是大端存儲(chǔ) (Big Endian) 的了;
  • 不同的國(guó)家和地區(qū)可以使用不同的編碼規(guī)則,這些編碼對(duì)應(yīng)到這些國(guó)家和地區(qū)的代碼頁(yè) (Code Page) 上。

1.1. ASCII編碼

ASCII編碼即美國(guó)信息交換標(biāo)準(zhǔn)代碼(American Standard Code for Information Interchange)是一套共有128個(gè)字符的編碼,它基于阿拉丁字母,主要作用是用來表示英語和西歐語言字符。ASCII規(guī)范編碼第一次公布于1967年,ascii碼在1986年完成最后一次更新。ASCII碼對(duì)照表等同于國(guó)際標(biāo)準(zhǔn) ISO/IEC 646,ASCII碼對(duì)照表是世界最通用的信息交換標(biāo)準(zhǔn)。

ASCII編碼

1.2. GB2312編碼

GB2312簡(jiǎn)體中文編碼,一個(gè)漢字占用2個(gè)字節(jié),在大陸是主要的編碼方式,兼容ASCII編碼。

為了支持繁體字,于是推出了GBK編碼,GBK是國(guó)標(biāo)擴(kuò)展(Guo Biao Kuozhan)編碼的縮寫,兼容GB2312。

為了支持少數(shù)名民族的文字,于是推出了GB1803,解決了中文、日文、朝鮮語等的編碼,兼容GBK。

中文編碼

2. UNICODE編碼

Unicode又稱為統(tǒng)一碼、萬國(guó)碼、單一碼,是國(guó)際組織制定的旨在容納全球所有字符的編碼方案,包括字符集、編碼方案等,它為每種語言中的每個(gè)字符設(shè)定了統(tǒng)一且唯一的二進(jìn)制編碼,以滿足跨語言、跨平臺(tái)的要求。

Unicode字符集被劃分為 17 個(gè)平面(即,17個(gè)區(qū),編號(hào)為 0-16 ),且具有以下特點(diǎn):

  • 每個(gè)平面有216 = 65536個(gè)代碼點(diǎn),因此,整個(gè)Unicode字符集共有17 × 65536 = 111 4112 個(gè)碼點(diǎn)。
  • 整個(gè)Unicode字符集的碼點(diǎn)空間為U+000000 ~ U+10FFFF
  • 每個(gè)平面的碼點(diǎn)范圍可表示為U+xx0000 ~ U+xxFFFF,其中xx表示16進(jìn)制的0x00到0x10,比如,平面0的碼點(diǎn)范圍為U+000000 ~ U+00FFFF,平面2的碼點(diǎn)范圍為U+020000 ~ U+02FFFF,平面15的碼點(diǎn)范圍為U+0F0000 ~ U+0FFFFF
  • 再次注意:并不是每個(gè)碼點(diǎn)就一定對(duì)應(yīng)有一個(gè)字符,因?yàn)?,目前Unicode字符集中有很多碼點(diǎn)都還未被使用。

Unicode 17 層平面

2.1. UTF-16編碼

UTF-16編碼源于UCS-2,是Unicode最早的編碼方式。

UCS-2編碼僅覆蓋了基本平面(即BMP,第0平面)中的碼點(diǎn),使用固定的兩字節(jié)將字符編號(hào)(類似于Unicode中的碼點(diǎn)值)直接映射為字符編碼,中間未經(jīng)過任何的編碼算法轉(zhuǎn)換。

很明顯,16位的二進(jìn)制位(范圍為0x0000 ~ 0xFFFF)無法表示Unicdoe引入的增補(bǔ)平面中的碼點(diǎn)(平面1 ~ 16,碼點(diǎn)范圍為0x10000~0x10FFFF),為此,Unicode在UTF-16編碼中使用“代理(代替)機(jī)制”來解決這個(gè)問題,代理機(jī)制使用4個(gè)字節(jié)來表示增補(bǔ)平面中的碼點(diǎn),從而使UTF-16成為一種變長(zhǎng)編碼方式。

因此,若軟件僅支持UCS-2編碼,則意味著僅支持UCS字符集或Unicode字符集基本平面中的字符,而不支持增補(bǔ)平面中的字符。

UTF-16編碼后的碼元序列在映射為物理意義上的字節(jié)序列時(shí),又分為UTF-16BE (大端序),UTF-16LE (小端序)兩種情況,大端序和小端序又分為帶有字節(jié)序標(biāo)記(with BOM)和不帶字節(jié)序標(biāo)記(without BOM)兩種情形。比如,“ABC”這三個(gè)字符的UTF-16編碼(碼元序列)為:00 41 00 42 00 43;其對(duì)應(yīng)的各種字節(jié)序列如下表所示:

”abc”的各種UTF-16編碼

2.2. UTF-32編碼

UTF-32是一種將Unicode字符編碼的協(xié)定,對(duì)每一個(gè)Unicode碼位使用恰好32位元。其它的Unicode transformation formats則使用不定長(zhǎng)度編碼。因?yàn)閁TF-32對(duì)每個(gè)字符都使用4字節(jié),就空間而言,是非常沒有效率的。特別地,非基本多文種平面的字符在大部分文件中通常很罕見,以致于它們通常被認(rèn)為不存在占用空間大小的討論,使得UTF-32通常會(huì)是其它編碼的二到四倍。雖然每一個(gè)碼位使用固定長(zhǎng)定的字節(jié)看似方便,它并不如其它Unicode編碼使用得廣泛。

與UTF-16一樣,也存在大端和小端存儲(chǔ)。

2.3. UTF-8編碼

UTF-8編碼是Unicode編碼的一種編碼形式。由1-6個(gè)字節(jié)表示一個(gè)字符,兼容ASCII編碼。

UTF-8編碼

3. MFC中的字符集

MFC字符集選擇多字節(jié)編碼時(shí),對(duì)應(yīng)的編碼是GBK編碼

MFC字符集選擇Unicode編碼時(shí),對(duì)應(yīng)的編碼是UTF-16編碼。

4. QT中的字符集

QString是按UTF-16存儲(chǔ)的。

1、當(dāng)選擇UTF-8編碼時(shí),QString構(gòu)造函數(shù)的參數(shù)對(duì)應(yīng)UTF-8編碼(默認(rèn)設(shè)置)。

QTextCodec *codec = QTextCodec::codecForName("UTF-8");
QTextCodec::setCodecForLocale(codec);
QString str = “右邊是UFT-8編碼的字符串”;

2、當(dāng)選擇GBK編碼時(shí),QString構(gòu)造函數(shù)的參數(shù)對(duì)應(yīng)GBK編碼。

QTextCodec *codec = QTextCodec::codecForName("UTF-8");
QTextCodec::setCodecForLocale(codec);
QString str = “右邊是GBK編碼的字符串”;

3、QString也可以指定編碼賦值。

QString str1 = QString::fromLocal8Bit(“GBK編碼字符串”);
QString str2 = QString::fromUtf8(“UTF-8編碼字符串”);

到此這篇關(guān)于一文弄懂字符集編碼的文章就介紹到這了,更多相關(guān)字符集編碼內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • qqwry.dat的數(shù)據(jù)結(jié)構(gòu)圖文解釋

    qqwry.dat的數(shù)據(jù)結(jié)構(gòu)圖文解釋

    QQwry.dat可以看作是一種數(shù)據(jù)文件,通過它能完成以下任務(wù)
    2009-02-02
  • 程序員鼓勵(lì)師插件Rainbow Fart(彩虹屁)

    程序員鼓勵(lì)師插件Rainbow Fart(彩虹屁)

    這篇文章主要介紹了程序員鼓勵(lì)師插件Rainbow Fart(彩虹屁)的相關(guān)知識(shí),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-06-06
  • kali?2021新手安裝教程與配置圖文詳解

    kali?2021新手安裝教程與配置圖文詳解

    kali是一種Linux系統(tǒng),kali是專門用來滲透的,他是由back track系統(tǒng)演化而來的,后面結(jié)合了lwhax,whoppix以及auditor才改名成kali,這篇文章主要介紹了kali?2021新手安裝教程與配置,需要的朋友可以參考下
    2022-05-05
  • SecureCRT的使用超詳細(xì)教程

    SecureCRT的使用超詳細(xì)教程

    SecureCRT是Windows下登錄UNIX或Linux服務(wù)器主機(jī)的軟件,優(yōu)點(diǎn)是可以一次創(chuàng)建多個(gè) Tab Page,連接多臺(tái)遠(yuǎn)程主機(jī),下面給大家介紹下SecureCRT的使用超詳細(xì)教程,感興趣的朋友一起看看吧
    2021-11-11
  • ol7.7安裝部署4節(jié)點(diǎn)hadoop 3.2.1分布式集群學(xué)習(xí)環(huán)境的詳細(xì)教程

    ol7.7安裝部署4節(jié)點(diǎn)hadoop 3.2.1分布式集群學(xué)習(xí)環(huán)境的詳細(xì)教程

    這篇文章主要介紹了ol7.7安裝部署4節(jié)點(diǎn)hadoop 3.2.1分布式集群學(xué)習(xí)環(huán)境,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-07-07
  • Delphi 本地路徑的創(chuàng)建、清空本地指定文件夾下的文件

    Delphi 本地路徑的創(chuàng)建、清空本地指定文件夾下的文件

    這篇文章主要介紹了Delphi 本地路徑的創(chuàng)建、清空本地指定文件夾下的文件,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2019-08-08
  • Git的撤銷、修改和回退命令

    Git的撤銷、修改和回退命令

    這篇文章介紹了Git的撤銷、修改和回退命令,對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2022-04-04
  • github版本庫(kù)使用詳細(xì)圖文教程(命令行及圖形界面版)

    github版本庫(kù)使用詳細(xì)圖文教程(命令行及圖形界面版)

    今天我們就來學(xué)習(xí)github的使用,我們將用它來管理我們的代碼,你會(huì)發(fā)現(xiàn)它的好處的,當(dāng)然是要在本系列教程全部完成之后,所以請(qǐng)緊跟站長(zhǎng)的步伐,今天是第一天,我們來學(xué)習(xí)如何在git上建立自己的版本倉(cāng)庫(kù),并將代碼上傳到倉(cāng)庫(kù)中
    2015-08-08
  • Webstorm解除版本控制的場(chǎng)景分析

    Webstorm解除版本控制的場(chǎng)景分析

    這篇文章主要介紹了Webstorm解除版本控制的場(chǎng)景分析,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-10-10
  • 如何使用postman(新手入門)

    如何使用postman(新手入門)

    Postman是google開發(fā)的一款功能強(qiáng)大的網(wǎng)頁(yè)調(diào)試與發(fā)送網(wǎng)頁(yè)HTTP請(qǐng)求,本文主要介紹了如何使用postman,具有一定的參考價(jià)值,感興趣的可以了解一下
    2022-01-01

最新評(píng)論