C++ string字符串的使用和簡單模擬實現

更新時間：2024年06月16日 11:51:39 作者：蕭瑟其中～

C語言中,字符串是以'\0'結尾的一些字符的集合,為了操作方便,C標準庫中提供了一些str系列的庫函數,但是這些庫函數和字符串是分離的,本文給大家介紹了C++ string字符串的使用和簡單模擬實現,感興趣的朋友可以參考下

前言

本文講解string串的使用和一些簡單的模擬實現，內容豐富，干貨多多！

1. string簡介

C語言中，字符串是以'\0'結尾的一些字符的集合，為了操作方便，C標準庫中提供了一些str系列的庫函數，但是這些庫函數和字符串是分離的。不符合面向對象程序設計的思想，而且底層空間需要用戶自己管理，如果不細心，容易訪問越界。

所以C++標準庫以string類來表示字符串，更加簡單，方便。

字符串是表示字符序列的對象。
標準string類通過類似于標準字節(jié)容器的接口提供了對此類對象的支持，但添加了專門設計用于操作單字節(jié)字符串的特性。
string類是basic_string類模板的實例化，該模板使用char(即字節(jié))作為其字符類型，具有默認的char_traits和allocator類型(有關模板的更多信息，請參閱basic_string)。
請注意，該類處理字節(jié)獨立于所使用的編碼:如果用于處理多字節(jié)或變長字符序列(如UTF-8)，則該類的所有成員(如length或size)及其迭代器仍將以字節(jié)(而不是實際編碼的字符)進行操作。

2. string的使用和簡單模擬實現

2.1 string類的定義

string類是本賈尼C++之父實現的，但是初次實現難免有許多不足，如接口函數過多，接口函數重載過多，導致string類十分復雜。我們對string類進行簡單的模擬實現，不過是實現一些常用的接口函數，主要是粗淺地了解其中的原理。

因為string這個容器專門針對字符，沒有使用類模版，所以定義和聲明需要分離，準備兩個文件string.h和string.cpp。string.h存放類的聲明，string.cpp各種類成員函數和變量的定義。
為了不跟C++標準庫里面的string發(fā)生命名沖突，可以將類放在命名空間中，并且這兩個文件可以使用同一個命名空間，編譯的過程中就會合并。
因為string物理存儲空間本質上是連續(xù)的，不是鏈表那種隨機存儲的。迭代器使用char*原生的字符指針就可以模擬，不過實際的string的迭代器基本是用類封裝實現。

#define _CRT_SECURE_NO_WARNINGS 
#pragma once
#include <iostream>
#include <assert.h>
using namespace std;
 
namespace Rustle
{
	class string
	{
	public:
		typedef char* iterator;
		typedef const char* const_iterator;
 
		iterator begin();
		iterator end();
		const_iterator begin() const;
		const_iterator end() const;
 
        //構造函數
		//string();
		string(const char* str = "");
        //拷貝構造函數
		string(const string& s);
        //賦值拷貝函數
		//string& operator=(const string& s);
		string& operator=(string tmp);
        //析構函數
		~string();
 
		void swap(string& s);
		const char* c_str() const;
		size_t size() const;
 
		char& operator[](size_t pos);
		const char& operator[](size_t pos) const;
 
		void reserve(size_t n);
		void push_back(char ch);
		void append(const char* str);
 
		string& operator+=(char ch);
		string& operator+=(const char* str);
 
		void insert(size_t pos, char ch);
		void insert(size_t pos, const char* str);
		void erase(size_t pos, size_t len = npos);
 
		size_t find(char ch, size_t pos = 0);
		size_t find(const char* str, size_t pos = 0);
		string substr(size_t pos = 0, size_t len = npos);
 
		bool operator<(const string& s)const;
		bool operator>(const string& s)const;
		bool operator<=(const string& s)const;
		bool operator>=(const string& s)const;
		bool operator==(const string& s)const;
		bool operator!=(const string& s)const;
		void clear();
	private:
		char* _str = nullptr;//置空
		size_t _size = 0;
		size_t _capacity = 0;
 
		const static size_t npos;
    };
 
	istream& operator>>(istream& is, string& str);
	ostream& operator<<(ostream& os, const string& str);
}

2.2 string(),~string()和c_str()

構造函數如果使用第一種寫法，將所有成員變量使用初始化列表進行初始化。一般來說是可以的，但是每一次都需要調用strlen這個庫函數，會消耗時間。
可能有的人會用第二種寫法，交換一下初始化列表中的順序，先將_size初始化，之后的成員變量直接使用_size就行。但是初始化列表初始化的順序跟函數中初始化列表順序無關，只跟成員變量聲明的順序有關。
最好的解決方案就是第三種構造函數的寫法，先使用初始化列表進行初始化，然后在函數內部進行動態(tài)開辟一塊與str相同大小的空間，使用strcpy拷貝str字符串的內容，strcpy還會自動在字符串末尾加上斜杠0。
需要注意的是，_size指的是字符串的大小，_capacity指的是斜杠0之前的字符個數，不包含斜杠0。所以之前_str中空間大小事_size+1，給斜杠0預留一個空間。
析構函數先釋放_str指向的空間，然后_str置為空指針，其他兩個成員變量置為0。
有些時候需要像C語言一樣訪問字符串，而string是一個類無法直接訪問，c_str函數就是解決這種問題，這個函數可以獲取_str指針，即第一個字符的地址。

namespace Greg
{
   //1.
    string::string(const char* str)
		:_str(new char[strlen(str) + 1])
        ,_size(strlen(str))
        ,_capacity(strlen(str))
	{
		assert(str);
		strcpy(_str, str);
	}
 
    //2.
    string::string(const char* str)
		:_size(strlen(str))
        ,_str(new char[_size + 1])
        ,_capacity(_size)
	{
		assert(str);
		strcpy(_str, str);
	}
 
	//全缺省構造函數
    string::string(const char* str)
		:_size(strlen(str))
	{
		assert(str);
 
		//初始化列表和函數內部初始化混合著用
		_str = new char[_size + 1];
		_capacity = _size;
		strcpy(_str, str);
	}
 
	string::~string()
	{
		delete[] _str;
		_str = nullptr;
		_size = _capacity = 0;
	}
 
	const char* string::c_str() const
	{
		return _str;
	}
}

寫一個測試函數，也放在Rustle命名空間中，這樣就string前面不用加域名限制符。

namespace Rustle
{
	void test_string1()
	{
		string s1("hello world");
		cout << s1.c_str() << endl;
    }
}

運行結果如下：

2.2 size，重載符號[ ]，begin和end函數

size是獲取字符個數的函數，直接返回_size就好。
[ ]下標訪問符，跟vector容器作用相似，訪問pos下標的元素，需要先斷言檢查pos是不是在合理的范圍，然后直接返回_str[pos]即可。不過返回類型是字符類型的引用，這樣可以對該字符進行修改
begin函數是返回字符串的第一個字符的地址，還有一個const修飾函數，算是函數重載。因為string類對象可能也被const修飾。
end函數返回的是字符串最后一字符的下一個位置，由于下標是從0開始的，直接返回_str+_size即可。

    string::iterator string::begin()
	{
		return _str;
	}
 
	string::iterator string::end()
	{
		return _str + _size;
	}
 
	string::const_iterator string::begin() const
	{
		return _str;
	}
 
	string::const_iterator string::end() const
	{
		return _str+ _size;
	}
 
	size_t string::size() const
	{
		return _size;
	}
 
	char& string::operator[](size_t pos)
	{
		assert(pos < _size);
		return _str[pos];
	}
 
	const char& string::operator[](size_t pos) const
	{
		assert(pos < _size);
		return _str[pos];
	}
}

寫一個測試函數，用下標訪問，迭代器訪問，還有范圍for循環(huán)訪問。范圍for的底層就是需要識別有沒有begin和end函數。

	void test_string1()
	{
		string s1("hello world");
		cout << s1.c_str() << endl;
 
		for (size_t i = 0; i < s1.size(); i++)
		{
			cout << s1[i] << " ";
		}
		cout << endl;
 
		for (auto e : s1)
		{
			cout << e << " ";
		}
		cout << endl;
 
		string::iterator it1 = s1.begin();
		while (it1 != s1.end())
		{
			cout << *it1 << " ";
			++it1;
		}
		cout << endl;
 
		const string s3("xxxxxx");
		string::const_iterator it2 = s3.begin();
		while (it2 != s3.end())
		{
			cout << *it2 << " ";
			++it2;
		}
		cout << endl;
	}

運行結果如下：

2.3 push_back，reserve，append，+=運算符重載

接口函數聲明如下，其中+=運算符重載函數有兩個重載，針對的是字符和字符串的。

		void reserve(size_t n);
		void push_back(char ch);
		void append(const char* str);
 
		string& operator+=(char ch);
		string& operator+=(const char* str);

reserve就是調整容量的函數。我們需要手動擴容。先開辟一個新容量大小的空間，然后使用strcpy庫函數將原字符串內容拷貝到tmp指針指向的空間上，再釋放_str指向的空間。讓_str指針指向tmp指向的空間，修改_capacity的大小。
push_back函數是在字符串的末尾加上一個字符。首先，我們要判斷字符串的容量是否足夠。當_size和_capacity相等時，說明字符串容量已滿，需要擴容。我們定義一個newcapacity變量，如果_capacity等于0，說明還沒有開空間，先給四個字符大小的容量大小，如果不等于0，按兩倍擴容。擴容之后，在_size下標位置添加ch字符，并且需要單獨處理斜杠0，加在新字符的后一個位置。修改_size。
append函數在原字符串上追加新字符串，會覆蓋原字符串。先定義len表示新字符串字符的個數，再判斷加上新字符串后是否超過容量，超過容量要擴容。然后使用strcpy拷貝新字符串，再修改_size。
+=運算符重載針對字符和字符串的兩個函數，分別復用push_back和append函數即可。需要返回*this。

	void string::reserve(size_t n)
	{
		if (n > _capacity)
		{   //給斜杠0預留一個位置
			char* tmp = new char[n + 1];
			strcpy(tmp, _str);
			delete[] _str;
 
			_str = tmp;
			_capacity = n;
		}
	}
 
	void string::push_back(char ch)
	{
		if (_size == _capacity)
		{
			size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
			reserve(newcapacity);
		}
 
		_str[_size] = ch;
		_str[_size + 1] = '\0';//單獨處理斜杠0
		++_size;
	}
 
	void string::append(const char* str)
	{
		size_t len = strlen(str);
		if (_size + len > _capacity)
		{
		    reserve(_size + len);
		}
 
		strcpy(_str + _size, str);
		_size += len;
	}
 
    //復用push_back和append函數
	string& string::operator+=(char ch)
	{
		push_back(ch);
		return *this;
	}
 
	string& string::operator+=(const char* str)
	{
		append(str);
		return *this;
	}

寫個測試函數，測試剛剛是模擬實現的函數。

	void test_string2()
	{
		string s1("hello world");
		cout << s1.c_str() << endl;
 
		s1.push_back('x');
		cout << s1.c_str() << endl;
 
		s1.append("aaaaaa");
		cout << s1.c_str() << endl;
 
		s1 += 'y';
		cout << s1.c_str() << endl;
 
		s1 += "dfsdf";
		cout << s1.c_str() << endl;
 
	}

運行結果如下：

2.4 insert和erase函數

上面是insert和erase函數的定義。insert函數從pos位置開始插入字符或者字符串，erase函數從pos位置開始，刪除len個字符，其中l(wèi)en變量給了缺省值npos。
npos是無符號整數，現在令npos = -1。如果 size_t 是 32 位的，那么 npos 等于 2^32 - 1，即 4294967295。如果 size_t 是 64 位的，那么 npos 等于 2^64 - 1，即 18446744073709551615。總之是一個非常大的數字，表示直接到末尾。

class string
{
public:
    void insert(size_t pos, char ch);
	void insert(size_t pos, const char* str);
	void erase(size_t pos, size_t len = npos);
 
private:
	const static size_t npos;
}

npos是一個靜態(tài)變量需要定義和聲明分離。
實現針對字符插入的insert函數。先判斷是否需要擴容，然后需要挪動元素，當你定義一個無符號整型end變量時，盡量不要讓無符號整數遇到大于等于或者小于等于符號，會有坑。
因為如果你while循環(huán)繼續(xù)的條件是end >= pos，并且此時pos等于0的情況下，你不斷讓end減1，當end減到0時，再次減去1會變成-1，如上面所說相當于 2^32 - 1，會造成無限循環(huán)。
有兩種解決方法，第一種就是不要出現等于符號，控制好end的位置。第二種是強轉pos為int，這樣使用等于判斷就不會出現無限循環(huán)的情況。
針對字符串插入的insert函數，使用上面第一種方法挪動元素，while循環(huán)繼續(xù)的條件比較難寫出來，需要畫圖理解。
實現erase函數，先判斷刪除的字符個數和從pos位置的字符到結尾字符個數的大小關系。如果大于原字符的個數，直接將斜杠0放在pos位置的字符即可，在修改_size的大小。如果小于，需要挪動元素，可以使用strcpy將刪除字符的最后一個位置拷貝到pos位置，就完成了刪除和挪動的操作。

    const size_t string::npos = -1;
 
//1.
void string::insert(size_t pos, char ch)
{
	assert(pos <= _size);
	if (_size == _capacity)
	{
		size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
		reserve(newcapacity);
	}
 
	//size_t無符號整數遇到大于等于有坑
	size_t end = _size + 1;
	while (end > pos)
	{
		_str[end] = _str[end - 1];
		--end;
	}
	_str[pos] = ch;
	++_size;
}
 
//2.
void string::insert(size_t pos, char ch)
{
	assert(pos <= _size);
	if (_size == _capacity)
	{
		size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
		reserve(newcapacity);
	}
 
    int end = _size;
	while (end >= (int)pos)
	{
		_str[end + 1] = _str[end];
		--end;
	}
	_str[pos] = ch;
	++_size;
}
 
//1.
void string::insert(size_t pos, const char* str)
{
	assert(pos <= _size);
 
	size_t len = strlen(str);
	if (_size + len > _capacity)
	{
		reserve(_size + len);
	}
 
	size_t end = _size + len;
	while (end > pos + len - 1)//!(pos + len - 1)
	{
		_str[end] = _str[end - len];
		--end;
	}
	memcpy(_str + pos, str, len);
	_size += len;
}
 
//2.
void string::insert(size_t pos, const char* str)
{
	assert(pos <= _size);
 
	size_t len = strlen(str);
	if (_size + len > _capacity)
	{
		reserve(_size + len);
	}
 
	int end = _size;
	while (end >= (int)pos)
	{
	    _str[end + len] = _str[end];
		--end;
	}
	memcpy(_str + pos, str, len);
	_size += len;
}
 
void string::erase(size_t pos, size_t len)
{
	assert(pos < _size);
 
	if (pos + len >= _size)
	{
		_str[pos] = '\0';
		_size = pos;
	}
	else
	{
		strcpy(_str + pos, _str + pos + len);
		_size -= len;
	}
}

寫個測試函數。測試一下模擬實現的函數。

	void test_string3()
	{
		string s1("hello world");
		cout << s1.c_str() << endl;
 
		s1.insert(0, 'x');
		cout << s1.c_str() << endl;
 
		string s2("helloworld");
		s2.insert(5, "xxxx");
		cout << s2.c_str() << endl;
 
		s2.erase(5, 4);
		cout << s2.c_str() << endl;
	}

運行結果如下：

2.5 find和substr函數

函數原型如下，find函數是查找某個字符或者字符串的位置，查找到返回該字符的下標位置或者該字符串第一個字符的位置。如果沒有找到返回-1，是一個極大的數。substr函數是從pos位置開始，取下原字符串的子串，返回一個string類的對象。

    size_t find(char ch, size_t pos = 0);
	size_t find(const char* str, size_t pos = 0);
	string substr(size_t pos = 0, size_t len = npos);

查找字符，直接遍歷整個字符串查找，找到返回下標，沒找到返回-1。
查找字符串，可以直接使用strstr庫函數，或者使用其他查找子串的算法。
實現substr函數，先判斷子串字符個數是否小于從pos位置開始的字符個數。如果大于，直接拷貝pos位置的字符串。如果小于，創(chuàng)建一個string類的臨時對象，先調整容量為len個，這樣就不會在頻繁擴容。然后使用for循環(huán)一個個加等。

	size_t string::find(char ch, size_t pos)
	{
		for (size_t i = 0; i < _size; i++)
		{
			if (_str[i] == ch)
				return i;
		}
		return npos;
	}
 
	size_t string::find(const char* str, size_t pos)
	{
		const char* end = strstr(_str, str);
 
		return end - _str;
	}
 
	string string::substr(size_t pos, size_t len)
	{
		//子串長度大于從原字符串給定位置開始到結束的長度，直接拷貝返回
		if (len > _size - pos)
		{
			string sub(_str + pos);
			return sub;
		}
		else
		{
			string sub;
			sub.reserve(len);
			for (size_t i = 0; i < len; i++)
			{
				sub += _str[pos + i];
			}
 
			return sub;
		}
	}

寫一個測試用例，用于分割網址。

	void test_string4()
	{
		string s1("helloworld");
		cout << s1.find('o') << endl;
		cout << s1.find("orl") << endl;
		
		string url("https://legacy.cplusplus.com/reference");
		size_t pos1 = url.find(":");
		string url1 = url.substr(0, pos1);
		cout << url1 << endl;
 
		size_t pos2 = url.find('/', pos1 + 3);
		string url2 = url.substr(pos1 + 3, pos2 - (pos1 + 3));
		cout << url2 << endl;
 
		string url3 = url.substr(pos2 + 1);
		cout << url3 << endl;
 
	}

運行結果如下：

2.6 比較運算符的重載

	bool operator<(const string& s)const;
	bool operator>(const string& s)const;
    bool operator<=(const string& s)const;
	bool operator>=(const string& s)const;
	bool operator==(const string& s)const;
	bool operator!=(const string& s)const;

比較運算符，是比較字符的ASCii碼值，可以寫完<和==的邏輯，然后其他進行復用。

	bool string::operator<(const string& s)const
	{
		return strcmp(_str, s._str) < 0;
	}
 
	bool string::operator>(const string& s)const
	{
		return !(*this < s) && !(*this == s);
	}
 
	bool string::operator<=(const string& s)const
	{
		return *this < s || *this == s;
	}
 
	bool string::operator>=(const string& s)const
	{
		return *this < s || *this == s;
	}
 
	bool string::operator==(const string& s)const
	{
		return strcmp(_str, s._str) == 0;
	}
 
	bool string::operator!=(const string& s)const
	{
		return !(*this == s);
	}

2.7 cout<<和cin>>運算符重載

重載流插入<<和流提取>>這兩個操作符，是為了方便打印和輸入。并且這是放在全局的函數。

	istream& operator>>(istream& is, string& str);
	ostream& operator<<(ostream& os, const string& str);

流插入<<函數容易實現，直接for循環(huán)遍歷打印每個字符即可，不過你可以按照你的意愿打印任何形式。
流提取<<函數比較難實現。首先寫一個clear函數，清理掉之前的字符串里的字符，可以直接將斜杠0放在下標為0的位置，再修改_size就好了。
首先，我們不能直接使用is >> ch來提取字符，因為一遇到空格或者換行就表示分割?？梢允褂胕s.get()函數完成輸入操作。然后，我們先創(chuàng)建一個字符數組，輸入的字符填到字符數組先，滿了在加載字符串中，可以防止頻繁擴容，帶來的消耗。

	ostream& operator<<(ostream& os, const string& str)
	{
		for (size_t i = 0; i < str.size(); i++)
		{
			os << str[i];
		}
 
		return os;
	}
 
    void string::clear()
	{
		_str[0] = '\0';
		_size = 0;
	}
 
    istream& operator>>(istream& is, string& str)
	{
		//空格和換行表示多個值的分割
		//is >> ch; //scanf("%c", &ch);
 
		str.clear();
		int i = 0;
		char buff[128];
		char ch = is.get();
 
		while (ch != ' ' && ch != '\n')
		{
			buff[i++] = ch;
			//0~126的位置放字符了，留一個位置給斜杠0
			//減少頻繁擴容
			if (i == 127)
			{
				buff[i] = '\0';
				str += buff;
				i = 0;
			}
 
			ch = is.get();
		}
 
		if (i != 0)
		{
			buff[i] = '\0';
			str += buff;
		}
 
		return is;
	}

寫個測試函數。

	void test_string7()
	{
		//string s1("hello world");
		string s1;
		cout << s1 << endl;
 
		cin >> s1;
		cout << s1 << endl;
	}

運行結果如下：

總結

以上就是C++ string字符串的使用和簡單模擬實現的詳細內容，更多關于C++ string使用和實現的資料請關注腳本之家其它相關文章！

您可能感興趣的文章:

數據結構 C語言實現循環(huán)單鏈表的實例
這篇文章主要介紹了數據結構 C語言實現循環(huán)單鏈表的實例的相關資料,需要的朋友可以參考下
2017-05-05
C語言中指針和數組試題詳解分析
變量存放在內存中，內存其實就是一組有序字節(jié)組成的數組，每個字節(jié)有唯一的內存地址。CPU 通過內存尋址對存儲在內存中的某個指定數據對象的地址進行定位。數據對象是指存儲在內存中的一個指定數據類型的數值或字符串，它們都有一個自己的地址，指針是保存這個地址的變量
2021-10-10
c++基礎語法:構造函數與析構函數
構造函數用來構造一個對象，主要完成一些初始化工作，如果類中不提供構造函數，編譯器會默認的提供一個默認構造函數(參數為空的構造函數就是默認構造函數) ；析構函數是隱式調用的，delete對象時候會自動調用完成對象的清理工作
2013-09-09
C語言中const和define的區(qū)別你了解嘛
這篇文章主要為大家詳細介紹了C語言中const和define的區(qū)別，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助
2022-03-03
C語言實現電影管理系統(tǒng)
這篇文章主要為大家詳細介紹了C語言實現電影管理系統(tǒng)，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2022-08-08
解決Visual?Studio?Code錯誤Cannot?build?and?debug?because?
這篇文章主要為大家介紹了解決Visual?Studio?Code錯誤Cannot?build?and?debug?because?the及分析，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2023-07-07
C++性能剖析教程之循環(huán)展開
這篇文章主要給大家介紹了關于C++性能剖析教程之循環(huán)展開的相關資料，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2018-06-06
VS2022永久配置OpenCV開發(fā)環(huán)境的實現
本文主要介紹了VS2022永久配置OpenCV開發(fā)環(huán)境的實現，文中通過示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2022-02-02
解析C++中的for循環(huán)以及基于范圍的for語句使用
這篇文章主要介紹了解析C++中的for循環(huán)以及基于范圍的for語句使用,是C++入門學習中的基礎知識,需要的朋友可以參考下
2016-01-01
C語言實現循環(huán)雙鏈表
這篇文章主要為大家詳細介紹了C語言實現循環(huán)雙鏈表，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2021-11-11