Cpp学习——string模拟实现

一，string的成员变量

二，string的各项功能函数

1.构造函数

2.析构函数

3.扩容函数

4.插入与删除数据的函数

5.+=运算符重载

6.打印显示函数

7，拷贝构造

8.find函数

一，string的成员变量

在模拟实现string之前，首先就要先知道string是个啥子。其实string可以简单的理解为一个管理字符的顺序表。顺序表内都有些啥啊？无非三个成员变量——1.数据的长度。2.顺序表的容量。3.字符串指针。所以模拟实现的时候这个string类定义如下：
class string{private:char* _str;size_t _size;size_t _capacity;};
这样便将一个string的容貌给描绘出来了。

二，string的各项功能函数

1.构造函数

在写顺序表的时候，我们都会先写一个初始化函数Init()，这个函数的功能便是初始化。但是在cpp中可不需要初始化函数。我们要实现初始化的功能只需要写一个构造函数然后再走初始化列表便可以了。代码如下：
    string():_str(nullptr), _size(0), _capacity(0){ }
当然，在对象里面我们要将权限设置为公有public。否则，我们是不能访问的，因为class里的权限默认为私有private。

2.析构函数

数据的销毁是必须的。否则就会留下内存泄露的隐患。析构函数的代码也是十分简单的，代码如下：
~string(){delete[]_str;//因为string管理的是一个字符串，所以得用delete[]。_str = nullptr;_size = _capacity = 0;}

3.扩容函数

要想将数据放入到string中，string就必须要有一定的空间来存放数据。所以，一个扩容函数是非常必要的。所以我要写一个扩容函数，这个扩容函数能够实现的是按照我的要求来扩容，但是不能缩容。代码如下：
	void reserve(size_t n){if (n > _capacity){char* tmp = new char[n + 1];if (_str){strcpy(tmp, _str);delete[]_str;}_str = tmp;_capacity = n;}}

4.插入与删除数据的函数

在实现了扩容函数以后再来实现尾插函数就可以变得十分的简单了。实现尾插函数只需要三步：1.利用reserve()函数检查是否需要扩容。2.在尾部插入想要插入的元素。3._size++再将_size位置上的数据变成'\0'。具体代码如下：
void push_back(char ch){if (_size == _capacity){reserve(_capacity == 0 ? 4 : 2 * _capacity);}_str[_size] = ch;_size++;_str[_size] = '\0';}
在实现了尾插函数后，其实我们可以发现尾插函数其实就只是关于单个字符插入的函数。但是，关于string的数据插入可不止插入一个字符啊。还有关于一段字符串插入的函数。所以在这里再来实现一个字符串插入函数append()。实现这个函数也分为三步：1.计算要插入字符串的长度len。2.检查_size+len与_capacity的大小来调用reserve()函数扩容。3.利用strcpy()函数插入字符串再将_size+=len。代码如下：
void append(const char* str){int len = strlen(str);if (len + _size > _capacity){reserve(len + _size);}strcpy(_str + _size, str);_size += len;}
中间插入函数insert()。中间插入函数也也要实现两种形式。1.插入一个字符。2.插入一个字符串。代码实现如下：
void insert(const char& ch, size_t pos = npos){assert(pos >= 0);assert(pos <= _size);if (_size == _capacity){reserve(_capacity == 0 ? 4 : 2 * _capacity);}size_t end = _size + 1;while (end > pos){_str[end] = _str[end - 1];end--;}_str[pos] = ch;_size++;}
插入一个字符串：
void insert(const char* str, size_t pos = npos){assert(pos >= 0);assert(pos <= _size);int len = strlen(str);if (_size+len == _capacity){reserve(_size+len);}size_t end = _size + len;while (end > pos){_str[end] = _str[end - len];end--;}strcpy(_str+pos, str);_size += len;}
这里要注意的就是end>pos这个条件。这里有类型转换，end一定是大于0的因为是size_t类型的。

删除数据的函数erase():
void erase(size_t pos,size_t len = npos){assert(pos >= 0);assert(pos <= _size);if (len == npos || pos + len >= _size){_str[pos] = '\0';_size = pos;}else{size_t end = pos + len;while (end <= _size){_str[end - len] = _str[end];end++;}_size = _size - len;}}
删除数据的函数只需要一个，想删除多少个数据便删除多少个数据。

5.+=运算符重载

实现了上面的两个函数以后会让+=运算符的实现变得轻而易举。+=运算符的实现分两种：

1.+=插入一个字符串，此时调用push_back()函数。2.+=字符串，此时调用append()函数。

因为两个函数的参数是不一样的，所以可以构成函数重载。这两个函数的代码如下：
string& operator+=(const char& ch){push_back(ch);return *this;}string& operator+=(const char* s){append(s);return *this;}

6.打印显示函数

上面的函数实现以后，验证起来还是有点麻烦的。因为显示起来有点麻烦。所以在这里便可以通过实现迭代器来实现范围for语法。首先迭代器的代码如下：
        char* begin(){return _str;}char* end(){return _str + _size;}const char* begin()const {return _str;}const char* end()const {return _str + _size;}
然后范围for便可以使用了：

在这里既然讲到了显示。那我们便可以实现一个针对于string的cout函数重载。代码如下：
ostream& operator <<(ostream& out,  const string& s){for (int i = 0;i < s.size();i++){out << s[i];}return out;}
既然实现了cout的重载，那怎么能不实现cin的重载呢？在这里说明一下，cin是在遇到空格或者换行的时候就放弃读取数据的。于是，按照cout的重载实现方式，我们很容易就会写出如下代码：
istream& operator>>(istream& in, string& s){char ch;in >> ch;while (ch != ' ' && ch != '\n'){s += ch;in >> ch;}return in;}
但是经过试验以后你会发现这个代码会出问题。问题就出在istream类型的in上面。当in读取到空格和换行的时候，in会自动跳过空格或者换行字符。也是ch便永远不可能为空格或者换行。所以这个函数会陷入死循环。所以在读取字符时，我们就得一个一个的读取。这时便要调用get()函数。改进代码如下：
istream& operator>>(istream& in, string& s){char ch;ch = in.get();while (ch != ' ' && ch != '\n'){s += ch;ch = in.get();}return in;}
但是这个代码还是有可以改进的地方的，比如我们的+=运算符的重载是调用了reserve()函数了的。调用这个函数便要考虑一下减少扩容的次数。怎么减少呢？减少的方法便是再增加一个buffer字符数组来接收ch。等到buffer数组接收数据满了以后再让s+=buffer。这样便可以减少扩容的次数。优化代码如下：
istream& operator>>(istream& in, string& s){s.clear();//一定得要对s进行清理数据，要不然会变成尾插。char ch;char buffer[129];size_t i = 0;ch = in.get();while (ch != ' ' && ch != '\n'){buffer[i++] = ch;if (i == 128){buffer[i] = '\0';s += buffer;i = 0;}ch = in.get();}if (i != 0){buffer[i] = '\0';s += buffer;}return in;}

7，拷贝构造

现在我想要实现用一个string对象去初始化另一个刚生成的对象。于是我们便会写上这样一个代码：
void test_string5(){string s1;s1.push_back(1);s1.push_back(1);s1.push_back(1);s1.push_back(1);for (auto e:s1){cout << e << " ";}cout << endl;string s2(s1);}
但是，毫无疑问这个代码会报错。因为s2会浅拷贝s1。于是这两个变量就会对同一块空间析构两次导致错误。所以我们需要一个拷贝构造的函数。拷贝构造函数代码如下：
string(const string& s){reserve(s.capacity());strcpy(_str, s._str);_size = s._size;_capacity = s._capacity;}
在写完了这个函数以后，便可以重载=了。代码如下：
string& operator=(string& s){char* tmp = new char[s._capacity+1];//记得开多一个空间来装'\0'。strcpy(tmp, s._str);delete[]_str;_str = tmp;_size = s._size;_capacity = s._capacity;return *this;}
通过写一个swap函数，上面的赋值重载函数还可以变得简洁：
        void swap(string& tmp){std::swap(_str, tmp._str);std::swap(_size, tmp._size);std::swap(_capacity, tmp._capacity);}string& operator=(string& s){string tmp(s);swap(tmp);return *this;}
当然拷贝构造函数也可以通过这样的方式来变得简洁：
void swap(string& tmp){std::swap(_str, tmp._str);std::swap(_size, tmp._size);std::swap(_capacity, tmp._capacity);}string(const string& s){string tmp(s._str);//前面有一个实现用字符串拷贝的函数swap(tmp);}
当然这需要一个用字符串拷贝的构造函数：
string(const char* s){int len = strlen(s);reserve(len);strcpy(_str, s);_size = len;}

8.find函数

在这里说明一下，find函数的作用是找到某个字符的下标或者某段字符串的第一个下标。然后返回该下标。通过这段文字，我们可以知道find()函数需要实现两种版本。

1.找字符的find()函数。2.寻找某段字符串的find()函数。

首先第一个版本就非常的简单了，主要的思想便是遍历匹配。所以第一种版本的代码实现如下：
      size_t find(const char& c,size_t pos = 0){assert(pos >= 0);assert(pos < _size);for (int i = 0;i < _size;i++){if (_str[i] == c){return i;}}return npos;}size_t find(const char*  substr,size_t pos = 0){assert(pos >= 0);assert(pos < _size);const char* p = strstr(_str+pos,substr);if (p){return p - _str;}return npos;}
//找子串的函数substr。string substr(size_t pos,size_t len = npos){string s;if (len == npos||pos+len>=_size){for (int i = pos;i < _size;i++){s += _str[i];}}else{for (int i = pos;i < len;i++){s += _str[i];}}return s;}
然后通过自己写的find函数测试一下：
void test_string7(){string s = "https://mp.csdn.net/mp_blog/creation/editor?spm=1011.2415.3001.6217";size_t begin = 0;size_t end = 0;end = s.find(":");cout << "协议：" << s.substr(begin, end) << endl;begin = end + 3;end = s.find("/", begin);cout << "域名：" << s.substr(begin, end) << endl;cout << "资源名:" << s.substr(end) << endl;}
结果：