ORALCE?substr函數(shù)及substrb與字符集關(guān)系詳解
ORALCE substr函數(shù)及substrb與字符集關(guān)系
語法
函數(shù)用途: SUBSTR函數(shù)用來截取從源字符(參數(shù) char)中截取一部分目標字符,截取方式為限定從源字符截取起始位置(參數(shù) positon),并限定截取目標字符長度(參數(shù) substring_length)。substr系列函數(shù)計算目標字符長度及開始截取字符位置長度的方式有所不同——substr函數(shù)為字符,substrb為字節(jié),substrc為UNICODE完全字符集,substr2為UCS2編碼代碼點,substr4為ucs4編碼代碼點。
- 參數(shù)position為0時,按1處理。
- 參數(shù)position為正數(shù)時,ORACLE數(shù)所庫查詢時從左到右從第一個字符開始計數(shù)。
- 參數(shù)position 為負數(shù)時,查詢從右向左從倒數(shù)第一個字符開始計數(shù)。
- 參數(shù)substring_length可為空,為空時直接從position位置開始向后截取所有字符(含position位置字符)。哪果substring為負值 ,則substr函數(shù)返還null。
char參數(shù)類型可以是 char,varchar2,nchar,nvarchar2,clob或者nclob,但除substr與substrb函數(shù)外,另外三個substr系列函數(shù)的參數(shù)char類型不允許 為CLOB(character large object) 或者NCLOB類型。position與substringlength參數(shù)數(shù)據(jù)類型必須是number數(shù)值型,或者可以被隱式轉(zhuǎn)換為number型的數(shù)據(jù)類型,并且最終最必須可以被轉(zhuǎn)換為整型。返回值的類型一般與char參數(shù)的數(shù)據(jù)類型一致,但char、nchar類型的參數(shù)返回值實際上分別為varchar2 、nvarchar2類型.position與substringlength參數(shù)如果為浮點型數(shù)據(jù)則被直接自動處理為整型數(shù)據(jù)。
示例:
1.
SELECT SUBSTR('ABCDEFG',3,4) "Substring" FROM DUAL;
以上語句返回'CDEF',即從第三個字符'C'開始,向右截取長度為4的目標字符,為'CDEF'.
2.
SELECT SUBSTR('ABCDEFG',-5,4) "Substring" FROM DUAL;
以上語句返回'CDEF',即從倒數(shù)第五個字符'C'開始,向右截取長度為4的目標字符,為'CDEF'.此處position參數(shù)為負值值是起始位置計算從右向左,但截取方向依然為從左向右,而instr(string,substring,position,occurence)函數(shù)position參數(shù)為負值 時,不僅取起始位置是從右向左,并且匹配計算目標字符串出現(xiàn)次數(shù)方向也是從右向左。
3.
SELECT SUBSTRB('ABCDEFG',5,4.2) "Substring with bytes" FROM DUAL;
substrb函數(shù)與substr函數(shù)不同之處在于它以字節(jié)來計數(shù),而substr函數(shù)僅單純以字符來計算,不論是中文還是英文。因此,由于數(shù)據(jù)庫系統(tǒng)字符集編碼方式的不一致,不同數(shù)據(jù)庫系統(tǒng)執(zhí)行上述語句結(jié)果可能有所不同。例3示例語句在GBK字符集下,字母占1字節(jié),因此返還值為'EFG',即從第5個字節(jié)'E'開始,向右截取4個字節(jié)(不滿4個截到末尾即可);而如果是UNICODE字符集,中英文均占2字節(jié),因此返還值為'CD'.下面是一些常見的編碼格式字符所占字節(jié)情況:
- 1、ASII:美國標準信息交換碼,用一個字節(jié)的7位可以表示。無漢字字符,一個字母對應(yīng)一個字節(jié)。;
- 2、ISO8859-1:拉丁碼表,歐洲碼表,用一個字節(jié)的8位可以表示;
- 3、GBK2312:中國的中文編碼表,最多兩個字節(jié)編碼所有字符。一個漢字2字節(jié),一個字母1字節(jié);
- 4、GBK:中國的中文編碼表升級,融合了更多的中文文字字符,最多兩個字節(jié)編碼。一個漢字2字節(jié),一個字母1字節(jié);
- 5、Unicode:國際標準碼,融合了目前人類使用的所有字符,為每個字符分配唯一的字符碼,所有的文字都用兩個字節(jié)來表示;
- 6、utf-8:變長的編碼方式,可用1-4個字節(jié)來表示一個字符?,F(xiàn)在最多的又有6個字節(jié)。一個漢字3字節(jié),一個字母1字節(jié); -7、utf-16:中文和字母都是占2個字節(jié)。 -8、utf-32:中文和字母都是占4個字節(jié)。
ORACLE字符串存儲方式
ORACLE數(shù)據(jù)庫中varchar2類型字符串有varchar2(n char) 和varchar2(n byte)兩種存放方式。一般直接定義為varchar2(n),這樣ORALCE會根據(jù)配置文件中的設(shè)置選擇以字節(jié)還是以字符為單位。查看具體是以哪種方式可能在PLSQL命令行輸入以下命令查看value值:
show parameter nls_length
ORACLE字符集
可能通過以下語句查詢當(dāng)前登錄數(shù)據(jù)庫字符集:
elect userenv('language') from dual;
ORACLE的字符存儲方式與字符集共同決定了一個varchar2型字段能存儲什么長度什么形式的字符,比如:一個varchar2(4)長度的字段,如果 采用的是GBK編碼方式,即一個漢字占2字節(jié),字母占1字節(jié),且存儲方式為byte,則此字段最多存儲2漢字,4字母。
參考文檔
ORALCE官網(wǎng) SQL Language Reference:
到此這篇關(guān)于ORALCE substr函數(shù)及substrb與字符集關(guān)系的文章就介紹到這了,更多相關(guān)ORALCE substr函數(shù)及substrb內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Oracle數(shù)據(jù)加載和卸載的實現(xiàn)方法
這篇文章主要介紹了Oracle數(shù)據(jù)加載和卸載的實現(xiàn)方法,非常不錯,具有一定的參考借鑒加載,需要的朋友可以參考下2018-08-08oracle wm_concat 列轉(zhuǎn)行 逗號分隔
oracle wm_concat函數(shù),用于列轉(zhuǎn)行,逗號分隔本文將詳細介紹此功能的應(yīng)用2012-11-11Oracle 數(shù)據(jù)庫中創(chuàng)建合理的數(shù)據(jù)庫索引
在Oracle數(shù)據(jù)庫中,創(chuàng)建索引雖然比較簡單。但是要合理的創(chuàng)建索引則比較困難了。2009-06-06Oracle中的translate函數(shù)用法小結(jié)
translate提供了與replate函數(shù)相關(guān)的功能, replace讓你用一個字符串替換另一個字符串,以及刪除字符串,本文結(jié)合實例代碼給大家介紹的非常詳細,感興趣的朋友一起看看吧2024-12-12基于ora2pg遷移Oracle19C到postgreSQL14的全過程
ora2pg是一個開源工具,可將Oracle數(shù)據(jù)庫模式轉(zhuǎn)換為PostgreSQL格式,支持導(dǎo)出數(shù)據(jù)庫絕大多數(shù)對象類型,本文就給大家介紹了基于ora2pg遷移Oracle19C到postgreSQL14的全過程,文中有詳細的代碼示例,需要的朋友可以參考下2023-11-11Oracle GoldenGate同步服務(wù)歸檔空間維護【推薦】
這篇文章主要介紹了Oracle GoldenGate同步服務(wù)歸檔空間維護的相關(guān)知識,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下2018-08-08