Rust字符串字面值的一些經(jīng)驗(yàn)總結(jié)
前言
Rust 中有兩種字符串,String 和 &str,其中 String 可動(dòng)態(tài)分配、修改,內(nèi)部實(shí)現(xiàn)可以理解為 Vec<u8>,而 &str 是一個(gè)類型為 &[u8] 的切片。這兩種字符串都只能保存合法的 UTF-8 字符。
而對(duì)于非肉眼可辨識(shí)的 UTF-8 字符,則可以考慮使用如下類型:
- 文件路徑有專用的 Path 和 PathBuf 類可用。
- 使用 Vec<u8> 和 &[u8]
- 使用 OSString 和 &OSStr 和操作系統(tǒng)交互
- 使用 CString 和 &CStr 和 C 庫(kù)交互
上面的第二種方法,就是常用的處理非 UTF-8 字節(jié)流的方式,也就是使用 Vec<u8> 和 &[u8] ,其中我們也可以使用字面值來(lái)處理這兩種類型的數(shù)據(jù),我們稱之為字節(jié)字符串字面值(byte string literals),其類型為 &[u8]。
字符串字面值(String literals)
先來(lái)看一下字符串字面值。
和其他語(yǔ)言一樣,用雙引號(hào)括起來(lái)就是一個(gè)字符串,不過(guò) Rust 的一個(gè)特點(diǎn)是字符串可以跨行,即中間有回車也不會(huì)引起編譯或運(yùn)行錯(cuò)誤,在輸出的時(shí)候也會(huì)帶著里面的換行符。
同樣,字符串字面值里面支持轉(zhuǎn)義,比如想在里面使用雙引號(hào),該轉(zhuǎn)義也會(huì)對(duì)換行符進(jìn)行轉(zhuǎn)義,比如下面這樣,在換行符前面使用 \ ,則該轉(zhuǎn)義符、換行符以及下一行開(kāi)頭的所有空格都將會(huì)被忽略:
let a = "foobar"; let b = "foo\ ? ? ? ? ?bar"; assert_eq!(a,b);
字符串字面值除了支持常見(jiàn)的 \ 對(duì)字節(jié)(字符)進(jìn)行轉(zhuǎn)義,還支持對(duì) Unicode 進(jìn)行轉(zhuǎn)義:
- \xHH: + 2位的十六進(jìn)制7位寬度字節(jié)碼,這相當(dāng)于等值的 ASCII 字符。
- \u{xxxx}:24位長(zhǎng)的16進(jìn)制,表示等值的 Unicode 字符。
- \n/\r/\t 表示 U+000A (LF), U+000D (CR) 和 U+0009 (HT)
- \\ 用來(lái)對(duì) \ 本身進(jìn)行轉(zhuǎn)義
- \0 表示 Unicode U+0000 (NUL)
Raw 類型的字符串字面值表示進(jìn)行轉(zhuǎn)義,也就是說(shuō)字面值寫的是什么內(nèi)容,字符串的值就是什么。這種類型的字面值使用 r 以及若干 # 開(kāi)頭進(jìn)行定義,結(jié)尾需要相等數(shù)量的 #。
如下所示:
"foo"; r"foo"; ? ? ? ? ? ? ? ? ? ? // foo "\"foo\""; r#""foo""#; ? ? ? ? ? ? // "foo" "foo #\"# bar"; r##"foo #"# bar"##; ? ? ? ? ? ? ? ?// foo #"# bar "\x52"; "R"; r"R"; ? ? ? ? ? ? ? ? // R "\\x52"; r"\x52"; ? ? ? ? ? ? ? ? ?// \x52
如果字符串中有雙引號(hào)怎么辦?因?yàn)?raw string 里不能使用轉(zhuǎn)義,所以 \" 是肯定不行的。Rust 實(shí)際支持使用 r# 的方式來(lái)指定字符串邊界。這個(gè) # 就是轉(zhuǎn)義的另一種實(shí)現(xiàn)方式,比如字符串里面有 4 個(gè) #,那么該字符串可以用 r#####"abc####def"##### 來(lái)包圍起來(lái),也就是比里面的 # 多即可。
Byte string literals
Byte string 字面值使用 b"..." 以及衍生語(yǔ)法定義,其類型為 &[u8],這個(gè)和 &str 是完全不一樣的類型,所以有些在 &str 上能用的方法,在 &[u8] 上是用不了的。
比如:
// &[u8; 5]: [119, 111, 114, 108, 100]! let world = b"world"; println!("Hello, {}!", world);
編譯會(huì)報(bào)錯(cuò),因?yàn)?&[u8] 沒(méi)有實(shí)現(xiàn) std::fmt::Display:
29 | println!("Hello, {}!", world);
| ^^^^^ `[u8; 5]` cannot be formatted with the default formatter
|= help: the trait `std::fmt::Display` is not implemented for `[u8; 5]`
= note: in format strings you may be able to use `{:?}` (or {:#?} for pretty-print) instead
= note: this error originates in the macro `$crate::format_args_nl` (in Nightly builds, run with -Z macro-backtrace for more info)
Byte string 字面值也支持轉(zhuǎn)義,但是需要注意它只支持字節(jié)轉(zhuǎn)義,不支持 Unicode 轉(zhuǎn)義。
// 支持字符轉(zhuǎn)義,輸出:Hello, Rust! let escaped = b"\x52\x75\x73\x74 as bytes"; // 不支持 Unicode 轉(zhuǎn)義,編譯錯(cuò)誤: // = help: unicode escape sequences cannot be used as a byte or in a byte string let escaped = b"\u{211D} is not allowed";
// Raw byte strings work just like raw strings let raw_bytestring = br"\u{211D} is not escaped here"; println!("{:?}", raw_bytestring); // Converting a byte array to `str` can fail if let Ok(my_str) = str::from_utf8(raw_bytestring) { ? ? println!("And the same as text: '{}'", my_str); }
字節(jié)字符串也支持 raw 定義,和標(biāo)準(zhǔn)字符串類型類似,使用 r 前綴定義 raw byte string 字面值變量。
例如下面的例子中普通的字節(jié)字符串需要轉(zhuǎn)義,raw 字節(jié)字符串就不需要使用 \ 進(jìn)行轉(zhuǎn)義了。
b"foo"; br"foo"; ? ? ? ? ? ? ? ? ? ? // foo b"\"foo\""; br#""foo""#; ? ? ? ? ? ? // "foo" b"foo #\"# bar"; br##"foo #"# bar"##; ? ? ? ? ? ? ? ? // foo #"# bar b"\x52"; b"R"; br"R"; ? ? ? ? ? ? ? ?// R b"\\x52"; br"\x52"; ? ? ? ? ? ? ? ? ?// \x52
總結(jié)
下面是剛才介紹的這幾種字符串字面值定義的一個(gè)總結(jié),列出了不同的定義方式和其含義。
符合 意義
“…” 字符串字面值
r"…“, r#”…“#, r##”…“##, etc. Raw 字符串字面值,禁止轉(zhuǎn)義
b"…“ 字節(jié)字符串字面值,類型為 &[u8]
br"…“, br#”…“#, br##”…“##, etc. Raw 字節(jié)字符串字面值
‘…’ 字符字面值
b'…‘ ASCII字節(jié)字面值
參考資料
到此這篇關(guān)于Rust字符串字面值的文章就介紹到這了,更多相關(guān)Rust字符串字面值內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Rust-使用dotenvy加載和使用環(huán)境變量的過(guò)程詳解
系統(tǒng)的開(kāi)發(fā),測(cè)試和部署離不開(kāi)環(huán)境變量,今天分享在Rust的系統(tǒng)開(kāi)發(fā)中,使用dotenvy來(lái)讀取和使用環(huán)境變量,感興趣的朋友跟隨小編一起看看吧2023-11-11Rust?編程語(yǔ)言中的所有權(quán)ownership詳解
這篇文章主要介紹了Rust?編程語(yǔ)言中的所有權(quán)ownership詳解的相關(guān)資料,需要的朋友可以參考下2023-02-02Rust編寫自動(dòng)化測(cè)試實(shí)例權(quán)威指南
這篇文章主要為大家介紹了Rust編寫自動(dòng)化測(cè)試實(shí)例權(quán)威指南詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-12-12Rust 數(shù)據(jù)分析利器polars用法詳解
這篇文章主要介紹了Rust 數(shù)據(jù)分析利器polars用法詳解,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友參考下吧2024-08-08如何在Rust中處理命令行參數(shù)和環(huán)境變量
在本章節(jié)中, 我們探討了Rust處理命令行參數(shù)的常見(jiàn)的兩種方式和處理環(huán)境變量的兩種常見(jiàn)方式,感興趣的朋友一起看看吧2023-12-12