C++ string字符串的使用和簡單模擬實現
前言
本文講解string串的使用和一些簡單的模擬實現,內容豐富,干貨多多!
1. string簡介
C語言中,字符串是以'\0'結尾的一些字符的集合,為了操作方便,C標準庫中提供了一些str系列的庫函數,但是這些庫函數和字符串是分離的。不符合面向對象程序設計的思想,而且底層空間需要用戶自己管理,如果不細心,容易訪問越界。
所以C++標準庫以string類來表示字符串,更加簡單,方便。
- 字符串是表示字符序列的對象。
- 標準string類通過類似于標準字節(jié)容器的接口提供了對此類對象的支持,但添加了專門設計用于操作單字節(jié)字符串的特性。
- string類是basic_string類模板的實例化,該模板使用char(即字節(jié))作為其字符類型,具有默認的char_traits和allocator類型(有關模板的更多信息,請參閱basic_string)。
- 請注意,該類處理字節(jié)獨立于所使用的編碼:如果用于處理多字節(jié)或變長字符序列(如UTF-8),則該類的所有成員(如length或size)及其迭代器仍將以字節(jié)(而不是實際編碼的字符)進行操作。
2. string的使用和簡單模擬實現
2.1 string類的定義
string類是本賈尼C++之父實現的,但是初次實現難免有許多不足,如接口函數過多,接口函數重載過多,導致string類十分復雜。我們對string類進行簡單的模擬實現,不過是實現一些常用的接口函數,主要是粗淺地了解其中的原理。
- 因為string這個容器專門針對字符,沒有使用類模版,所以定義和聲明需要分離,準備兩個文件string.h和string.cpp。string.h存放類的聲明,string.cpp各種類成員函數和變量的定義。
- 為了不跟C++標準庫里面的string發(fā)生命名沖突,可以將類放在命名空間中,并且這兩個文件可以使用同一個命名空間,編譯的過程中就會合并。
- 因為string物理存儲空間本質上是連續(xù)的,不是鏈表那種隨機存儲的。迭代器使用char*原生的字符指針就可以模擬,不過實際的string的迭代器基本是用類封裝實現。
#define _CRT_SECURE_NO_WARNINGS #pragma once #include <iostream> #include <assert.h> using namespace std; namespace Rustle { class string { public: typedef char* iterator; typedef const char* const_iterator; iterator begin(); iterator end(); const_iterator begin() const; const_iterator end() const; //構造函數 //string(); string(const char* str = ""); //拷貝構造函數 string(const string& s); //賦值拷貝函數 //string& operator=(const string& s); string& operator=(string tmp); //析構函數 ~string(); void swap(string& s); const char* c_str() const; size_t size() const; char& operator[](size_t pos); const char& operator[](size_t pos) const; void reserve(size_t n); void push_back(char ch); void append(const char* str); string& operator+=(char ch); string& operator+=(const char* str); void insert(size_t pos, char ch); void insert(size_t pos, const char* str); void erase(size_t pos, size_t len = npos); size_t find(char ch, size_t pos = 0); size_t find(const char* str, size_t pos = 0); string substr(size_t pos = 0, size_t len = npos); bool operator<(const string& s)const; bool operator>(const string& s)const; bool operator<=(const string& s)const; bool operator>=(const string& s)const; bool operator==(const string& s)const; bool operator!=(const string& s)const; void clear(); private: char* _str = nullptr;//置空 size_t _size = 0; size_t _capacity = 0; const static size_t npos; }; istream& operator>>(istream& is, string& str); ostream& operator<<(ostream& os, const string& str); }
2.2 string(),~string()和c_str()
- 構造函數如果使用第一種寫法,將所有成員變量使用初始化列表進行初始化。一般來說是可以的,但是每一次都需要調用strlen這個庫函數,會消耗時間。
- 可能有的人會用第二種寫法,交換一下初始化列表中的順序,先將_size初始化,之后的成員變量直接使用_size就行。但是初始化列表初始化的順序跟函數中初始化列表順序無關,只跟成員變量聲明的順序有關。
- 最好的解決方案就是第三種構造函數的寫法,先使用初始化列表進行初始化,然后在函數內部進行動態(tài)開辟一塊與str相同大小的空間,使用strcpy拷貝str字符串的內容,strcpy還會自動在字符串末尾加上斜杠0。
- 需要注意的是,_size指的是字符串的大小,_capacity指的是斜杠0之前的字符個數,不包含斜杠0。所以之前_str中空間大小事_size+1,給斜杠0預留一個空間。
- 析構函數先釋放_str指向的空間,然后_str置為空指針,其他兩個成員變量置為0。
- 有些時候需要像C語言一樣訪問字符串,而string是一個類無法直接訪問,c_str函數就是解決這種問題,這個函數可以獲取_str指針,即第一個字符的地址。
namespace Greg { //1. string::string(const char* str) :_str(new char[strlen(str) + 1]) ,_size(strlen(str)) ,_capacity(strlen(str)) { assert(str); strcpy(_str, str); } //2. string::string(const char* str) :_size(strlen(str)) ,_str(new char[_size + 1]) ,_capacity(_size) { assert(str); strcpy(_str, str); } //全缺省構造函數 string::string(const char* str) :_size(strlen(str)) { assert(str); //初始化列表和函數內部初始化混合著用 _str = new char[_size + 1]; _capacity = _size; strcpy(_str, str); } string::~string() { delete[] _str; _str = nullptr; _size = _capacity = 0; } const char* string::c_str() const { return _str; } }
寫一個測試函數,也放在Rustle命名空間中,這樣就string前面不用加域名限制符。
namespace Rustle { void test_string1() { string s1("hello world"); cout << s1.c_str() << endl; } }
運行結果如下:
2.2 size,重載符號[ ],begin和end函數
- size是獲取字符個數的函數,直接返回_size就好。
- [ ]下標訪問符,跟vector容器作用相似,訪問pos下標的元素,需要先斷言檢查pos是不是在合理的范圍,然后直接返回_str[pos]即可。不過返回類型是字符類型的引用,這樣可以對該字符進行修改
- begin函數是返回字符串的第一個字符的地址,還有一個const修飾函數,算是函數重載。因為string類對象可能也被const修飾。
- end函數返回的是字符串最后一字符的下一個位置,由于下標是從0開始的,直接返回_str+_size即可。
string::iterator string::begin() { return _str; } string::iterator string::end() { return _str + _size; } string::const_iterator string::begin() const { return _str; } string::const_iterator string::end() const { return _str+ _size; } size_t string::size() const { return _size; } char& string::operator[](size_t pos) { assert(pos < _size); return _str[pos]; } const char& string::operator[](size_t pos) const { assert(pos < _size); return _str[pos]; } }
寫一個測試函數,用下標訪問,迭代器訪問,還有范圍for循環(huán)訪問。范圍for的底層就是需要識別有沒有begin和end函數。
void test_string1() { string s1("hello world"); cout << s1.c_str() << endl; for (size_t i = 0; i < s1.size(); i++) { cout << s1[i] << " "; } cout << endl; for (auto e : s1) { cout << e << " "; } cout << endl; string::iterator it1 = s1.begin(); while (it1 != s1.end()) { cout << *it1 << " "; ++it1; } cout << endl; const string s3("xxxxxx"); string::const_iterator it2 = s3.begin(); while (it2 != s3.end()) { cout << *it2 << " "; ++it2; } cout << endl; }
運行結果如下:
2.3 push_back,reserve,append,+=運算符重載
接口函數聲明如下,其中+=運算符重載函數有兩個重載,針對的是字符和字符串的。
void reserve(size_t n); void push_back(char ch); void append(const char* str); string& operator+=(char ch); string& operator+=(const char* str);
- reserve就是調整容量的函數。我們需要手動擴容。先開辟一個新容量大小的空間,然后使用strcpy庫函數將原字符串內容拷貝到tmp指針指向的空間上,再釋放_str指向的空間。讓_str指針指向tmp指向的空間,修改_capacity的大小。
- push_back函數是在字符串的末尾加上一個字符。首先,我們要判斷字符串的容量是否足夠。當_size和_capacity相等時,說明字符串容量已滿,需要擴容。我們定義一個newcapacity變量,如果_capacity等于0,說明還沒有開空間,先給四個字符大小的容量大小,如果不等于0,按兩倍擴容。擴容之后,在_size下標位置添加ch字符,并且需要單獨處理斜杠0,加在新字符的后一個位置。修改_size。
- append函數在原字符串上追加新字符串,會覆蓋原字符串。先定義len表示新字符串字符的個數,再判斷加上新字符串后是否超過容量,超過容量要擴容。然后使用strcpy拷貝新字符串,再修改_size。
- +=運算符重載針對字符和字符串的兩個函數,分別復用push_back和append函數即可。需要返回*this。
void string::reserve(size_t n) { if (n > _capacity) { //給斜杠0預留一個位置 char* tmp = new char[n + 1]; strcpy(tmp, _str); delete[] _str; _str = tmp; _capacity = n; } } void string::push_back(char ch) { if (_size == _capacity) { size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2; reserve(newcapacity); } _str[_size] = ch; _str[_size + 1] = '\0';//單獨處理斜杠0 ++_size; } void string::append(const char* str) { size_t len = strlen(str); if (_size + len > _capacity) { reserve(_size + len); } strcpy(_str + _size, str); _size += len; } //復用push_back和append函數 string& string::operator+=(char ch) { push_back(ch); return *this; } string& string::operator+=(const char* str) { append(str); return *this; }
寫個測試函數,測試剛剛是模擬實現的函數。
void test_string2() { string s1("hello world"); cout << s1.c_str() << endl; s1.push_back('x'); cout << s1.c_str() << endl; s1.append("aaaaaa"); cout << s1.c_str() << endl; s1 += 'y'; cout << s1.c_str() << endl; s1 += "dfsdf"; cout << s1.c_str() << endl; }
運行結果如下:
2.4 insert和erase函數
- 上面是insert和erase函數的定義。insert函數從pos位置開始插入字符或者字符串,erase函數從pos位置開始,刪除len個字符,其中l(wèi)en變量給了缺省值npos。
- npos是無符號整數,現在令npos = -1。如果
size_t
是 32 位的,那么npos
等于2^32 - 1
,即4294967295。
如果size_t
是 64 位的,那么npos
等于2^64 - 1
,即18446744073709551615。
總之是一個非常大的數字,表示直接到末尾。
class string { public: void insert(size_t pos, char ch); void insert(size_t pos, const char* str); void erase(size_t pos, size_t len = npos); private: const static size_t npos; }
- npos是一個靜態(tài)變量需要定義和聲明分離。
- 實現針對字符插入的insert函數。先判斷是否需要擴容,然后需要挪動元素,當你定義一個無符號整型end變量時,盡量不要讓無符號整數遇到大于等于或者小于等于符號,會有坑。
- 因為如果你while循環(huán)繼續(xù)的條件是end >= pos,并且此時pos等于0的情況下,你不斷讓end減1,當end減到0時,再次減去1會變成-1,如上面所說相當于
2^32 - 1,會造成無限循環(huán)。
- 有兩種解決方法,第一種就是不要出現等于符號,控制好end的位置。第二種是強轉pos為int,這樣使用等于判斷就不會出現無限循環(huán)的情況。
- 針對字符串插入的insert函數,使用上面第一種方法挪動元素,while循環(huán)繼續(xù)的條件比較難寫出來,需要畫圖理解。
- 實現erase函數,先判斷刪除的字符個數和從pos位置的字符到結尾字符個數的大小關系。如果大于原字符的個數,直接將斜杠0放在pos位置的字符即可,在修改_size的大小。如果小于,需要挪動元素,可以使用strcpy將刪除字符的最后一個位置拷貝到pos位置,就完成了刪除和挪動的操作。
const size_t string::npos = -1; //1. void string::insert(size_t pos, char ch) { assert(pos <= _size); if (_size == _capacity) { size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2; reserve(newcapacity); } //size_t無符號整數遇到大于等于有坑 size_t end = _size + 1; while (end > pos) { _str[end] = _str[end - 1]; --end; } _str[pos] = ch; ++_size; } //2. void string::insert(size_t pos, char ch) { assert(pos <= _size); if (_size == _capacity) { size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2; reserve(newcapacity); } int end = _size; while (end >= (int)pos) { _str[end + 1] = _str[end]; --end; } _str[pos] = ch; ++_size; } //1. void string::insert(size_t pos, const char* str) { assert(pos <= _size); size_t len = strlen(str); if (_size + len > _capacity) { reserve(_size + len); } size_t end = _size + len; while (end > pos + len - 1)//!(pos + len - 1) { _str[end] = _str[end - len]; --end; } memcpy(_str + pos, str, len); _size += len; } //2. void string::insert(size_t pos, const char* str) { assert(pos <= _size); size_t len = strlen(str); if (_size + len > _capacity) { reserve(_size + len); } int end = _size; while (end >= (int)pos) { _str[end + len] = _str[end]; --end; } memcpy(_str + pos, str, len); _size += len; } void string::erase(size_t pos, size_t len) { assert(pos < _size); if (pos + len >= _size) { _str[pos] = '\0'; _size = pos; } else { strcpy(_str + pos, _str + pos + len); _size -= len; } }
寫個測試函數。測試一下模擬實現的函數。
void test_string3() { string s1("hello world"); cout << s1.c_str() << endl; s1.insert(0, 'x'); cout << s1.c_str() << endl; string s2("helloworld"); s2.insert(5, "xxxx"); cout << s2.c_str() << endl; s2.erase(5, 4); cout << s2.c_str() << endl; }
運行結果如下:
2.5 find和substr函數
函數原型如下,find函數是查找某個字符或者字符串的位置,查找到返回該字符的下標位置或者該字符串第一個字符的位置。如果沒有找到返回-1,是一個極大的數。substr函數是從pos位置開始,取下原字符串的子串,返回一個string類的對象。
size_t find(char ch, size_t pos = 0); size_t find(const char* str, size_t pos = 0); string substr(size_t pos = 0, size_t len = npos);
- 查找字符,直接遍歷整個字符串查找,找到返回下標,沒找到返回-1。
- 查找字符串,可以直接使用strstr庫函數,或者使用其他查找子串的算法。
- 實現substr函數,先判斷子串字符個數是否小于從pos位置開始的字符個數。如果大于,直接拷貝pos位置的字符串。如果小于,創(chuàng)建一個string類的臨時對象,先調整容量為len個,這樣就不會在頻繁擴容。然后使用for循環(huán)一個個加等。
size_t string::find(char ch, size_t pos) { for (size_t i = 0; i < _size; i++) { if (_str[i] == ch) return i; } return npos; } size_t string::find(const char* str, size_t pos) { const char* end = strstr(_str, str); return end - _str; } string string::substr(size_t pos, size_t len) { //子串長度大于從原字符串給定位置開始到結束的長度,直接拷貝返回 if (len > _size - pos) { string sub(_str + pos); return sub; } else { string sub; sub.reserve(len); for (size_t i = 0; i < len; i++) { sub += _str[pos + i]; } return sub; } }
寫一個測試用例,用于分割網址。
void test_string4() { string s1("helloworld"); cout << s1.find('o') << endl; cout << s1.find("orl") << endl; string url("https://legacy.cplusplus.com/reference"); size_t pos1 = url.find(":"); string url1 = url.substr(0, pos1); cout << url1 << endl; size_t pos2 = url.find('/', pos1 + 3); string url2 = url.substr(pos1 + 3, pos2 - (pos1 + 3)); cout << url2 << endl; string url3 = url.substr(pos2 + 1); cout << url3 << endl; }
運行結果如下:
2.6 比較運算符的重載
bool operator<(const string& s)const; bool operator>(const string& s)const; bool operator<=(const string& s)const; bool operator>=(const string& s)const; bool operator==(const string& s)const; bool operator!=(const string& s)const;
比較運算符,是比較字符的ASCii碼值,可以寫完<和==的邏輯,然后其他進行復用。
bool string::operator<(const string& s)const { return strcmp(_str, s._str) < 0; } bool string::operator>(const string& s)const { return !(*this < s) && !(*this == s); } bool string::operator<=(const string& s)const { return *this < s || *this == s; } bool string::operator>=(const string& s)const { return *this < s || *this == s; } bool string::operator==(const string& s)const { return strcmp(_str, s._str) == 0; } bool string::operator!=(const string& s)const { return !(*this == s); }
2.7 cout<<和cin>>運算符重載
重載流插入<<和流提取>>這兩個操作符,是為了方便打印和輸入。并且這是放在全局的函數。
istream& operator>>(istream& is, string& str); ostream& operator<<(ostream& os, const string& str);
- 流插入<<函數容易實現,直接for循環(huán)遍歷打印每個字符即可,不過你可以按照你的意愿打印任何形式。
- 流提取<<函數比較難實現。首先寫一個clear函數,清理掉之前的字符串里的字符,可以直接將斜杠0放在下標為0的位置,再修改_size就好了。
- 首先,我們不能直接使用is >> ch來提取字符,因為一遇到空格或者換行就表示分割??梢允褂胕s.get()函數完成輸入操作。然后,我們先創(chuàng)建一個字符數組,輸入的字符填到字符數組先,滿了在加載字符串中,可以防止頻繁擴容,帶來的消耗。
ostream& operator<<(ostream& os, const string& str) { for (size_t i = 0; i < str.size(); i++) { os << str[i]; } return os; } void string::clear() { _str[0] = '\0'; _size = 0; } istream& operator>>(istream& is, string& str) { //空格和換行表示多個值的分割 //is >> ch; //scanf("%c", &ch); str.clear(); int i = 0; char buff[128]; char ch = is.get(); while (ch != ' ' && ch != '\n') { buff[i++] = ch; //0~126的位置放字符了,留一個位置給斜杠0 //減少頻繁擴容 if (i == 127) { buff[i] = '\0'; str += buff; i = 0; } ch = is.get(); } if (i != 0) { buff[i] = '\0'; str += buff; } return is; }
寫個測試函數。
void test_string7() { //string s1("hello world"); string s1; cout << s1 << endl; cin >> s1; cout << s1 << endl; }
運行結果如下:
總結
以上就是C++ string字符串的使用和簡單模擬實現的詳細內容,更多關于C++ string使用和實現的資料請關注腳本之家其它相關文章!
相關文章
解決Visual?Studio?Code錯誤Cannot?build?and?debug?because?
這篇文章主要為大家介紹了解決Visual?Studio?Code錯誤Cannot?build?and?debug?because?the及分析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-07-07VS2022永久配置OpenCV開發(fā)環(huán)境的實現
本文主要介紹了VS2022永久配置OpenCV開發(fā)環(huán)境的實現,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-02-02解析C++中的for循環(huán)以及基于范圍的for語句使用
這篇文章主要介紹了解析C++中的for循環(huán)以及基于范圍的for語句使用,是C++入門學習中的基礎知識,需要的朋友可以參考下2016-01-01