Bootstrap

【C++】————string基础用法及部分函数底层实现

 9efbcbc3d25747719da38c01b3fa9b4f.gif

                                                      作者主页:     作者主页

                                                      本篇博客专栏:C++

                                                      创作时间 :2024年6月30日

9efbcbc3d25747719da38c01b3fa9b4f.gif

前言:

 本文主要介绍STL容器之一  ----  string,在学习C++的过程中,我们要将C++视为一个语言联邦(摘录于Effective C++ 条款一)。如何理解这句话呢,我们学习C++,可将其分为四个板块;分别为C、Object-Oriented C++(面向对象的C++)、Template C++(模板)、STL。本文就介绍STL中的string;

一、string是什么?

  string是STL文档的容器之一,是一个自定义类型,是一个类,由类模板basic_string实例化出来的一个类;

我们看一下cplusplus上是咋介绍的?

我们简单看一下即可,下面我来为大家做介绍。

二、string的使用:

  由于string出现的时间实际是早于STL的,是后来划分进STL库的,所以string开始的设计比较冗余,有许多没有必要的接口(一共106个接口函数);这也是被广大C++程序员吐槽的一个槽点,我们无需将每一个接口都记住,我们需要将核心接口记住并熟练使用,遇见一些默认的接口查看文档即可;

2.1构造函数

        在C++98中,string的构造函数一种有如下7种;

int main()
{
	// 1、无参默认构造
	// string();
	string s1;
	// 2、拷贝构造   
	// string (const string& str);
	string s2(s1);
	// 4、通过字符串常量初始化   
	// string (const char* s);
	string s4("hello world");
	// 3、通过字符串子串初始化   
	// string (const string& str, size_t pos, size_t len = npos);
	string s3(s4, 5, 5);
	// 5、通过字符串前n个字符初始化   
	// string (const char* s, size_t n);
	string s5("hello wrold", 6);
	// 6、用n个字符c初始化字符串  
	//  string (size_t n, char c);
	string s6(10, 'x');
	// 7、迭代器区间初始化(暂不介绍)
	return 0;
}

 其中提一下第三种,pos为子串的位置,len子串的长度,若len大于从子串pos位置开始后面字符总数,则表示初始化到子串结尾即可,比如我们要用 “hello world” 初始化字符串,若pos为6,len为20,则用world初始化字符串s1;len还有一个缺省值npos,其数值为无符号整型的-1,也就是无符号的最大值(无符号无负数);

2.2赋值重载:

赋值重载使string能够用=对string对象重新赋值,string的赋值重载一共有有如下三种;

int main()
{
	string tmp("hello world");
	string s1;
	string s2;
	string s3;
	// 1、string类进行赋值重载
	s1 = tmp;
	// 2、使用字符串常量赋值重载
	s2 = "hello world";
	// 3、使用字符赋值重载
	s3 = 'A';
    return 0;
}

2.3容量相关接口

 首先介绍如下六个简单一些的接口;

int main()
{
	string s1("hello world");
	// string中储存的字符个数(不包括\0)
	cout << s1.length() << endl;
	// 与length功能相同
	cout << s1.size() << endl;
	// 可以最多储存多少个字符(理论值,实际上并没有那么多)
	cout << s1.max_size() << endl;
	// string的当前容量
	cout << s1.capacity() << endl;
	// 当前string对象是否为空
	cout << s1.empty() << endl;
	// 清空s1中所有字符
	s1.clear();
    return 0;
}

 其中的length与size两种并无相异,由于string出现的较早,当时没有STL其他容器,先出现了length,后来为了统一接口,于其他容器接口保持一致,因此出现了size;

int main()
{
	// reserve 提前开空间(可能会大于指定的大小,因此开空间规则不同)
	string s1;
	s1.reserve(100);
	cout << s1.size() << endl;
	cout << s1.capacity() << endl;
	// resize 提前开空间并初始化 缺省值为0
	string s2;
	s2.resize(100);
	cout << s2.size() << endl;
	cout << s2.capacity() << endl;
	s2 += "hhhhhh";
    return 0;
}

  我们发现reserve仅仅只是修改capacity,而resize不仅会修改capacity,还会修改size,然后用第二个参数取去初始化新增的区间;当指定大小小于原来空间时,reserve什么都不会做,而resize则会则断大于指定大小后面的区域(在后面补零);

总结:reserve仅改变capacity,resize既改变capacity又改变size;当指定大小小于字符串的size时,resize还可以截断(在后面补 \0 )

2.4迭代器

    迭代器是STL库中的一个特殊的存在,我们可以通过迭代器对string类中的字符进行增删查改; 在string类中,我们可将其视为指针;string类中的迭代器接口有如下几种;

 begin函数返回的是字符串中第一个字符的位置的迭代器,而end函数返回的字符串中最后一个字符的下一个位置的迭代器; 因此遍历一个string类,有一下三种方法;

int main()
{
	string s1("hello world");
	// 三种遍历方式
	// 1、通过[]来访问每一个字符
	for (int i = 0; i < s1.size(); i++)
	{
		cout << s1[i] << " ";
	}
	cout << endl;
	// 2、通过迭代来来访问每一个字符
	string::iterator it = s1.begin();
	while (it != s1.end())
	{
		cout << *it << " ";
		it++;
	}
	cout << endl;
	// 3、通过范围for(其实范围for就是编译器替换成了迭代器遍历的方法)
	for (auto ch : s1)
	{
		cout << ch << " ";
	}
	cout << endl;
    return 0;
}

     rbegin与rend系列为反向迭代器;rbegin返回的是最后一个字符的位置的迭代器,rend返回的是第一个字符的前一个位置的迭代器;

 我们可以通过反向迭代器,对其逆向遍历;反向迭代器的类型为 string::reverse_iterator;

int main()
{	
    string s1("hello world");
    string::reverse_iterator rit = s1.rbegin();
	while (rit != s1.rend())
	{
		cout << *rit << " ";
		rit++;
	}
 
}

2.5下标访问:

    关于元素的访问,也有如下四个接口,最常用的还是方括号; 

int main()
{
	// []重载使string可以像字符数组一样访问
	string s1("hello world");
	cout << s1[0] << endl;
	cout << s1[1] << endl;
	// at 于[] 功能相同,只不过[]的越界是由assert来限制,而at则是抛异常
	cout << s1.at(0) << endl;
	cout << s1.at(1) << endl;
	// front访问string中第一个字符
	cout << s1.front() << endl;
	// back访问string中最后一个字符
	cout << s1.back() << endl;
    return 0;
}

方括号的使用如同数组的方括号使用相同;at与方括号用法相同,只是遇见非法访问时是抛异常解决;

2.6修改

string的修改接口设计得十分冗余;其中我们可以用+=替代append与push_back;实际中,也是+=用得比较多,但是我们还是了解一下相关用法; 

  +=我们可以加等一个string类,可以加等一个字符,也可以加等一个字符指针;因此有以下用法;

int main()
{
	string tmp("xxxx");
	string s1("hello world");
	// += 字符
	s1 += ' ';
	// += string类
	s1 += tmp;
	// += 字符指针
	s1 += " hello world";
	cout << s1 << endl;
}

int main()
{
	string tmp("xxxx");
	string s1;
	// 尾加字符
	// void push_back (char c);
	s1.push_back('c');
	// 尾加string类  
	// string& append (const string& str);
	s1.append(tmp);
	// 尾加string从subpos位置开始的sublen个字符   
	//string& append (const string& str, size_t subpos, size_t sublen);
	s1.append(tmp, 2, 3);
	// 用字符指针指向的字符串/字符尾加
	// string& append (const char* s);
	s1.append("hello world");
	// 用字符指针指向的字符串的前n个字符尾加
	// string& append (const char* s, size_t n);
	s1.append("hello world", 6);
	// 尾加n个c字符   
	// string& append (size_t n, char c);
	s1.append(5, 'x');
	// 迭代器区间追加
	// template <class InputIterator>
	// string& append(InputIterator first, InputIterator last);
    s1.append(tmp.begin(), tmp.end());
	cout << s1 << endl;
    return 0;
}

 assign为string的赋值函数;是一个扩增版的operator =,用的并不多,主要用法如下;

int main()
{
	string tmp("hello world");
	string s1;
	// 使用string类对其赋值
	// string& assign (const string& str);
	s1.assign(tmp);
	cout << s1 << endl;
	// 使用string类中从subpos位置开始的sublen个串来赋值
	// string& assign (const string& str, size_t subpos, size_t sublen);
	s1.assign(tmp, 2, 5);
	cout << s1 << endl;
	// 使用字符指针所指向的字符串对其赋值
	// string& assign (const char* s);
	s1.assign("hello naiths");
	cout << s1 << endl;
	// 使用字符指针所指向的字符串的前n个对其赋值
	// string& assign (const char* s, size_t n);
	s1.assign("hello naiths", 7);
	cout << s1 << endl;
	// 使用n个c字符对其赋值
	// string& assign (size_t n, char c);
	s1.assign(10, 'x');
	cout << s1 << endl;
	// 使用迭代器对其赋值
	// template <class InputIterator>
	// string& assign(InputIterator first, InputIterator last);
    s1.assign(tmp.begin(), tmp.end());
    cout << s1 << endl;
    return 0;
}

int main()
{
	string tmp("hello world");
	string s1;
	// 在pos位置插入string类字符串
	// string& insert (size_t pos, const string& str);
	s1.insert(0, tmp);
	cout << s1 << endl;
	// 在pos位置插入str的子串(subpos位置开始的sublen个字符)
	// string& insert (size_t pos, const string& str, size_t subpos, size_t sublen);
	s1.insert(7, tmp, 0, 6);
	cout << s1 << endl;
	// 在pos位置插入字符指针指向的字符串
	// string& insert (size_t pos, constchar* s);
	s1.insert(2, "xxx");
	cout << s1 << endl;
	// 在pos位置插入字符指针指向的字符串的前n个字符
	// string& insert (size_t pos, const char* s, size_t n);
	s1.insert(7, "hello naiths", 8);
	cout << s1 << endl;
	// 在pos位置插入n个c字符
	// string& insert (size_t pos, size_t n, char c);
	s1.insert(0, 5, 'y');
	cout << s1 << endl;
	// 指定迭代器的位置插入n个字符c
	// void insert (iterator p, size_t n, char c);
	string::iterator it = s1.begin() + 10;
	s1.insert(it, 10, 'z');
	cout << s1 << endl;
	// 指定迭代器的位置插入字符c
	// iterator insert (iterator p, char c);
	s1.insert(s1.begin(), 'A');
	cout << s1 << endl;
	// 指定p位置插入迭代器区间的字符
	// template <class InputIterator>
	// void insert(iterator p, InputIterator first, InputIterator last);
	s1.insert(s1.begin(), tmp.begin() + 3, tmp.begin() + 8);
	cout << s1 << endl;
	// 删除pos位置开始的len个字符
	// string& erase (size_t pos = 0, size_t len = npos);
	s1.erase(2, 5);
	cout << s1 << endl;
	// 删除迭代器位置的那个字符
	// iterator erase (iterator p);
	s1.erase(s1.begin());
	cout << s1 << endl;
	// 删除迭代器区间的字符
	// iterator erase (iterator first, iterator last);
	s1.erase(s1.begin() + 2, s1.begin() + 5);
	cout << s1 << endl;
    return 0;
}

三、string底层实现

其实对于上面的这些库里面的函数,我们不需要全去记住,记住一些常用的即可,其他的等到我们要用到的时候去cplusplus网站里面找即可,对于下面我们要自己实现的函数,一定要记住,这些函数用的都是比较多的。

#pragma once
#define _CRT_SECURE_NO_WARNINGS

#include<iostream>
#include<assert.h>
using namespace std;


namespace bit
{
	class string
	{
	public:
		//string();//不传参的情况
		string(const string& s);
		string(const char* str = "");//这里可以之际全缺省
		~string();
		const char* c_str() const;

		size_t size() const;
		char& operator[](size_t pos);
		const char& operator[](size_t pos) const;
		string& operator=(const string& s);
		//实现一个迭代器
		typedef char* iterator;
		iterator begin();
		iterator end();

		typedef const char* const_iterator;
		const_iterator begin() const;
		const_iterator end() const;



		void reserve(size_t n);

		void push_back(char ch);
		void append(const char* str);

		string& operator+=(char ch);
		string& operator+=(const char* str);


		void insert(size_t pos, char ch);
		void insert(size_t pos, const char* str);
		void erase(size_t pos, size_t len=npos);
		size_t find(char ch, size_t pso = 0);
	    size_t find(const char* str, size_t pos = 0);
		void swap(string& s);
		string substr(size_t pos,size_t len);
		void clear();
	private:
		char* _str;
		size_t _size;
		size_t _capacity;


		const static size_t npos;
	};
	

	istream& operator>>(istream& is, string& str);
	ostream& operator<<(ostream& os, const string& str);

}


上面这些就是我们要实现的一些函数的底层是什么样的,当然,我只是基于自己的理解去写这些,比起C++库里面的肯定要low一点,所以我们理解基础的一些思路即可。

下面我们来看一下这些代码,大家看一下,想要更好的理解可以自己去实现一遍。

#include"string.h"




namespace bit
{
	//深拷贝
	string::string(const string& s)
	{
		_str = new char[s._capacity + 1];
		strcpy(_str, s._str);
		_size = s._size;
		_capacity = s._capacity;
	}
	 const size_t string::npos = -1;
	//不传参的析构
	//string::string()
	/*{
		_str = new char[1] {'\0'};
		_size = 0;
		_capacity = 0;
	}*/

	//构造函数
	string::string(const char* str)
		//strlen是运行时计算长度,效率比较低,三个strlen重复计算了
		//但是如果像下面这样写,还是会出现一些问题,因为初始化列表的初始化是按声明的顺序初始化,这里就会出现问题
		/*:_str(new char[strlen(str) + 1])
		,_size(strlen(str))
		,_capacity(strlen(str))*/
		: _size(strlen(str))
		
	{
		_capacity = _size;
		_str = new char[_size + 1];
		strcpy(_str, str);
	}

	//赋值
	string& string::operator=(const string& s)
	{
		//避免自己给自己赋值
		if (this != &s)
		{
			char* tmp = new char[s._capacity + 1];
			strcpy(tmp, s._str);
			//这样写是为了避免前面的空间大小小于后面的那个
			delete[] _str;
			_str = tmp;
			
		}
		return *this;
	}

	//析构
	string::~string()
	{
		delete[] _str;
		_size = 0;
		_capacity = 0;
	}

	//打印
	const char* string::c_str() const//像这种用于打印的函数,可以在后面加上一个const,
		                             //加上const意味着不能修改指向的内容和本事的值,这样即使放生权限的缩小依然不会报错
	{
		return _str;
	}


	size_t string::size() const
	{
		return _size;
	}

	char& string::operator[](size_t pos)//可读可写
	{
		assert(pos < _size);
		return _str[pos];
	}

	const char& string::operator[](size_t pos) const
	{
		assert(pos < _size);
		return _str[pos];
	}


	//迭代器
	string::iterator string::begin()
	{
		return _str;
	}
	string::iterator string::end()
	{
		return _str + _size;
	}

	//无法修改的迭代
	string::const_iterator string::begin() const
	{
		return _str;
	}
	string::const_iterator string::end() const
	{
		return _str + _size;
	}


	void string::reserve(size_t n)
	{
		if (n > _capacity)
		{
			char* tmp = new char[n + 1];
			strcpy(tmp, _str);
			delete[]_str;

			_str = tmp;
			_capacity = n;
		}
		
	}

	void string::push_back(char ch)
	{
		if (_size == _capacity)
		{
			size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
			reserve(newcapacity);
		}
		_str[_size] = ch;
		_str[++_size] = '\0';
	}

	void string::append(const char* str)
	{
		size_t len = strlen(str);
		if (_size + len > _capacity)
		{
            reserve(_size + len);
		}
		strcpy(_str + _size, str);
		_size += len;
	}
	

	string& string::operator+=(char ch)
	{
		push_back(ch);

		return *this;
	}

	string& string::operator+=(const char* str)
	{
		append(str);

		return *this;
	}

	void string::insert(size_t pos, const char* str)
	{
		assert(pos <= _size);

		size_t len = strlen(str);
		if (_size + len >= _capacity)
		{
			reserve(_size + len);
		}
		int end = _size;
		while (end >= pos)
		{
			_str[end+len] = _str[end];
			--end;
		}

		memcpy(_str + pos, str, len);
		_size += len;
		
	}

	void string::insert(size_t pos,char ch)
	{
		if (_size == _capacity)
		{
			size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
			reserve(newcapacity);
		}
		
		size_t end = _size;
		while (end >= pos)
		{
			_str[end + 1] = _str[end];
			--end;
		}
		_str[pos] = ch;

	}

	void string::erase(size_t pos, size_t len)
	{
		assert(pos <= _size);

		//当len大于前面的个数
		if (len>=_size-pos)
		{
			_str[pos] = '\0';
			_size = pos;
		}
		else
		{
			strcpy(_str + pos, _str + pos + len);
			_size -= len;
		}
	}

	size_t string::find(char ch, size_t pos)
	{
		
		while (pos!=_size)
		{
			if (ch == _str[pos])
			{
				return pos;
			}
			++pos;
		}
		return npos;
	}

    size_t string::find(const char* str, size_t pos)
	{
		char* p = strstr(_str + pos, str);
		return p - _str;
	}


	void string::swap(string& s)
	{
		std::swap(_str, s._str);
		std::swap(_capacity, s._capacity);
		std::swap(_size, s._size);
	}

	string string::substr(size_t pos, size_t len)
	{
		//len大于后面的剩余字符,有多少取多少
		if (len > _size - pos)
		{
			string sub(_str - pos);
			return sub;
		}
		else
		{
			string sub;
			sub.reserve(len);
			for (size_t i = 0; i < len; i++)
			{
				sub += _str[pos + i];

			}
			return sub;
		}
	}

	void string::clear()
	{
		_str[0] = '\0';
		_size = 0;
	}

	istream& operator>>(istream& is, string& str)
	{
		char ch;
		is >> ch;
		while (ch != ' ' && ch != '\n')
		{
			str += ch;
			is >> ch;
		}

		return is;
	}

	ostream& operator<<(ostream& os, const string& str)
	{
		for (size_t i = 0; i < str.size(); i++)
		{
			os << str[i];
		}

		return os;
	}
	
}

	

最后:

十分感谢你可以耐着性子把它读完和我可以坚持写到这里,送几句话,对你,也对我:

1.一个冷知识:
屏蔽力是一个人最顶级的能力,任何消耗你的人和事,多看一眼都是你的不对。

2.你不用变得很外向,内向挺好的,但需要你发言的时候,一定要勇敢。
正所谓:君子可内敛不可懦弱,面不公可起而论之。

3.成年人的世界,只筛选,不教育。

4.自律不是6点起床,7点准时学习,而是不管别人怎么说怎么看,你也会坚持去做,绝不打乱自己的节奏,是一种自我的恒心。

5.你开始炫耀自己,往往都是灾难的开始,就像老子在《道德经》里写到:光而不耀,静水流深。

最后如果觉得我写的还不错,请不要忘记点赞✌,收藏✌,加关注✌哦(。・ω・。)

愿我们一起加油,奔向更美好的未来,愿我们从懵懵懂懂的一枚菜鸟逐渐成为大佬。加油,为自己点赞!

;