Rust 字符串的基本操作
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
Rust 核心語言只有一種字符串類型,那就是字符串切片 str,它的借用形式更常見 &str。 String 類型,不屬于核心語言,而是由 Rust 標(biāo)準(zhǔn)庫提供。它是一種長度可變、內(nèi)容可變、擁有所有權(quán)的 UTF-8 編碼字符串類型。 創(chuàng)建新字符串 String 其實(shí)是矢量類型的封裝,矢量類型 Vec<T> 的許多操作在 String 上都能找到。比如,創(chuàng)建空白字符串的 new() 方法。 如果想使用現(xiàn)成的字符串初始化 String,可以使用 to_string() 方法。所有實(shí)現(xiàn) Display 特征的類型都有這個(gè)方法,比如字符串字面量。 還可以使用 String::from() 創(chuàng)建字符串。 因?yàn)樽址?UTF-8,你可以在其中存儲(chǔ)各國語言,甚至包括 emoji。 更新字符串 使用 push_str(string) 向字符串尾部添加新字符串。參數(shù)是字符串切片類型 &str,因此不會(huì)占有參數(shù)的所有權(quán)。 使用 push(ch) 向字符串尾部添加單個(gè)字符: 拼接兩個(gè) String,可以使用加號(hào) +。加號(hào)運(yùn)算符會(huì)調(diào)用 add() 函數(shù),其簽名如下:
因此,使用 + 執(zhí)行完拼接操作,原字符串將失去所有權(quán): 當(dāng)拼接多個(gè)字符串,代碼寫起來很不方便: 此時(shí),使用 format! 宏會(huì)更方便。format! 宏的用法 println! 宏的用法類似,只不過不是向終端打印信息,而是返回 String 類型的值。 format! 宏的可讀性更好,并且它不會(huì)搶奪字符串的所有權(quán),之后可以繼續(xù)使用原來的字符串。 字符串索引 在其他編程語言,訪問字符串索引是個(gè)常見操作。但是,如果你在 Rust 中進(jìn)行此類操作,會(huì)得到一個(gè)錯(cuò)誤: 之所以 Rust 禁止對(duì)字符串進(jìn)行索引操作,是因?yàn)?UTF-8 是一種變長編碼方案,有的字符使用 1 個(gè)字節(jié)表示,有的字符則需要 2 個(gè)字節(jié)甚至更多。因此,索引位置和字符并非一一對(duì)應(yīng)。 為了避免含糊不清,防止可能帶來的問題,Rust 干脆禁止在字符串上使用索引值。 Rust 禁用字符串的另一個(gè)原因時(shí),索引操作的時(shí)間復(fù)雜度應(yīng)當(dāng)是常量時(shí)間O(1)。但這在 UTF-8 中難以實(shí)現(xiàn),因?yàn)槊看嗡夹枰獜念^開始遍歷,才能發(fā)現(xiàn)當(dāng)前位置屬于哪個(gè)字符。 字符串切片 如果你確實(shí)想截取字符串的一部分,必須要更明確的告知 Rust 編譯器,你期望截取的數(shù)據(jù)類型,是字節(jié)、字符、還是圖元簇? 比如,你可以使用區(qū)間語法 [a..b] 截取特定范圍內(nèi)的字節(jié)序列。 如果你截取的字節(jié)序列不是一個(gè)完整的 UTF-8 編碼,Rust 會(huì) panic 退出。使用字符串切片務(wù)必小心。 遍歷字符串 使用 for 循環(huán)字符串時(shí),務(wù)必明確你的遍歷元素類型。 使用 chars() 返回一個(gè)遍歷字符的迭代器。 如果想遍歷字符串的所有字節(jié),使用 bytes() 方法: 如果你要遍歷圖元簇,Rust 標(biāo)準(zhǔn)庫不提供這種功能,需要去 crates.io 自行解決。 Storing UTF-8 Encoding Text with Strings https://doc.rust-lang.org/stable/book/ch08-02-strings.html 該文章在 2024/12/28 11:54:43 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |