c++介绍与入门基础（详细总结），2024年最新大数据开发性能优化和内存优化面试

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip204888 （备注大数据）

正文

std命名空间的使用惯例

在日常练习中，建议直接using namespace std即可，这样就很方便。

using namespace std展开，标准库就全部暴露出来了，如果我们定义跟库重名的类型/对象/函数，就存在冲突问题。该问题在日常练习中很少出现，但是项目开发中代码较多、规模大，就很容易出现。所以建议在项目开发中使用，像std::cout这样使用时指定命名空间 + using std::cout展开常用的库对象/类型等方式。

缺省参数

缺省参数概念

缺省参数是声明或定义函数时为函数的参数指定一个默认值，在调用该函数时，如果没有指定实参则采用该默认值，否则使用指定的实参。

#include <iostream>

using namespace std;
void Func(int a = 0)
{
	cout << a << endl;
}

int main()
{

	Func(); // 没有传参时，使用参数的默认值
	Func(10); // 传参时，使用指定的实参

	return 0;
}

说明：

使用c语言时，我们是不能给参数进行设置初始值的–语法要求；当我们使用时会出报错，参数的初始化错误。但是在c++中是可以的，相当于直接给函数的参数设置了一个初始值，当调用函数不传实参时就会得到我们设置的初始值。

缺省参数分类

1.全缺省参数

将全部参数设置初始值

#include <iostream>
using namespace std;
void Func(int a = 10, int b = 20, int c = 30)
{
	cout << "a = " << a << endl;
	cout << "b = " << b << endl;
	cout << "c = " << c << endl;
}

int main()
{

	Func();
	Func(100); 
	Func(100,200);
	Func(100,200,300);

	return 0;
}

2.半缺省参数

将一部分参数设置初始值

void Func(int a, int b = 10, int c = 20)
{
	cout << "a = " << a << endl;
	cout << "b = " << b << endl;
	cout << "c = " << c << endl;
}

int main()
{

	//Func();//因为第一个参数没有设置初始值，所以第一个参数需要穿实参
	Func(100); 
	Func(100,200);
	Func(100,200,300);

	return 0;
}

注意：

半缺省参数必须从右往左依次来给出，不能间隔着给

缺省值必须是常量或者全局变量

C语言不支持（编译器不支持）

缺省参数不能在函数声明和定义中同时出现

第4点说明

//a.h文件

  void Func(int a = 10);
  
  // a.cpp文件

  void Func(int a = 20)
 {}
  
  // 注意：如果生命与定义位置同时出现，恰巧两个位置提供的值不同，那编译器就无法确定到底该
用那个缺省值。

函数重载

函数重载跟我们生活中一词多意很像，人们可以通过上下文或者语境来判断该词真实的含义，即该词被重载了。好比如你喜欢的女孩对你说：你很好！或者成为女朋友了对你说：我很好！

函数重载概念

是函数的一种特殊情况，C++允许在同一作用域中声明几个功能类似的同名函数，这些同名函数的形参列表(参数个数或类型或类型顺序)不同，常用来处理实现功能类似数据类型不同的问题。

1.参数类型不同

int Add(int left, int right)
{
 cout << "int Add(int left, int right)" << endl;
 return left + right;
}

double Add(double left, double right)
{
 cout << "double Add(double left, double right)" << endl;
 return left + right;
}

int main()
{
 Add(10, 20);
 Add(10.1, 20.2);
 return 0;
}

2、参数个数不同

void f()
{
	cout << "f()" << endl;
}

void f(int a)
{
	cout << "f(int a)" << endl;
}

int main()
{
	f();
	f(10);
    return 0;
}

3、参数类型顺序不同

void f(int a, char b)
{
	cout << "f(int a,char b)" << endl;
}

void f(char b, int a)
{
	cout << "f(char b, int a)" << endl;
}

int main()
{
	f(10, 'a');
	f('a', 10);
	return 0;
}

C++支持函数重载的原理–名字修饰(name Mangling)

在这里我们必须知道这几过程：预处理、编译、汇编、链接。重拾：c–程序环境与预处理。首先我们知道预处理是将各个文件代码展开，然后把该替换的替换了，该删除的删除了。然后进入编译阶段，将c语言代码转换成汇编指针，在这过程中有词法分析，语法分析等。再这就汇编阶段，它将汇编代码转换为计算机认识的二进制指令，这里重点就是会生成符号表，符号表中有函数名和地址。

下面就是编译阶段，在linux下gcc环境和g++环境编译完成阶段的两端代码。

采用C语言编译器编译后结果：

这里我们仔细观察得到，在linux下，采用gcc编译完成后，这里的函数名没有任何修饰，如果我们用两个相同的函数名，编译器是无法辨别的。

采用C++编译器编译后结果：

那么在linux下，采用g++编译完成后，我们发现函数是得到修饰的。**编译器将函数参数类型信息添加到修改后的名字中。**这里好比两个红玫瑰苹果，一个是红玫瑰125克，一个是红玫瑰124克。他们都可以装在一个苹果篮子里，但是都能取分开。

我们在c++环境下，通过对函数名字的修饰（(name Mangling），让相同的函数不同的功能得以实现。只要参数不同，修饰出来的名字就不一样，就支持了重载。但是不同系统函数修饰规则是有不同的。

在最后链接阶段，通过连接器（Linker）将所有二进制形式的目标文件和系统组件组合成一个可执行文件。

引用

引用概念

引用不是新定义一个变量，而是给已存在变量取了一个别名，编译器不会为引用变量开辟内存空间，它和它引用的变量共用同一块内存空间。

这里就比好：蔡徐坤，在篮球上粉丝都爱称：“鸡，你太美”。其他方面上，粉丝亲切叫一声：“哥哥或者坤坤”。

类型& 引用变量名(对象名) = 引用实体；

#include <iostream>

void TestRef()
{
	int a = 10;
	int& ra = a;//<====定义引用类型

	printf("%p\n", &a);
	printf("%p\n", &ra);
}

int main()
{
	TestRef();

	return 0;
}

注意：引用类型必须和引用实体是同种类型的

引用特性

引用在定义时必须初始化

一个变量可以有多个引用

引用一旦引用一个实体，再不能引用其他实体

void TestRef()
{
	int a = 10;
	// int& ra;   // （1）该条语句编译时会出错
	int b = 20;


	int& ra = a;
	int& ra = b;//(3)报错：重定义；多次初始化
	int& rra = a;
	printf("%p %p %p\n", &a, &ra, &rra);
}

int main()
{
	TestRef();

	return 0;
}

常引用

const 类型 & 引用名;

**作用：**是不希望对所引用的内容进行修改。

void TestConstRef()
{
	const int a = 10;
	//int& ra = a;   //（1） 该语句编译时会出错，a为常量

	const int& ra = a;

	// int& b = 10; //（2） 该语句编译时会出错，b为常量
	const int& b = 10;

	double d = 12.34;
	//int& rd = d; // （3）该语句编译时会出错，类型不同

	const int& rd = d;
}

解释：

出错1：

a被const修饰，a的权限被缩小，而这里却想将a的权限扩大，在操作系统中权限只能缩小，不能被扩大，解决办法const int& ra=a；

出错2：

引用的值必须为左值，b为常量。常量是一个真实值，可读，所以b为右值。那么左值相当于地址。因为这里b是在进行初始化，是一个临时对象。所以这里错误就是右值引用。右值进行引用的时候需要被const修饰，const int& b = 10；

右值引用简单理解，就是绑定到左值的引用，右值引用的特点是：它将让其所绑定的右值重获新生，即使该右值本身是一个临时变量，但是它本身却不能绑定任何左值。

错误3：

d为double类型，引用不能改变类型。那么这里加const让rd变成可读，相当于对d建立临时变量，以前我们遇到的截断，提升都属于通建立临时变量解决的问题的。

运用：

void func(const int& b)
{
	cout << "b:" << &b << endl;
	int c = b;
	cout << "c:" << &c << endl;
	c++;
	cout << "c value" << c << endl;

}

int main()
{

	int a = 10;
	cout << "a:" << &a << endl;
	func(a);

	return 0;
}

可以看出a和b的地址一样，而c与b的地址不一样，可以修改c的值，但是无法修改b的内容。

使用场景

1.做参数

void Swap(int& left, int& right)
{
	int temp = left;
	left = right;
	right = temp;
}


int main()
{
	int a = 5, b = 6;

	Swap(a,b);
	cout << a <<" "<< b << endl;

	return 0;
}

以前我们学习c语言是用的指针，现在我们学习c++就可以用引用替代，而且书写代码更加简洁。

2.做返回值

这里引用做返回值使用是就需要特别小心，因为会发生函数栈帧，当函数被销毁的时候，他原来的空间就会被覆盖，那么有可能会我们用得到的返回值，再去进行访问时就找到原来那个值。

列如：

这里使用static，返回值n是静态变量，存放的空间是在全局区（代码区）而不是栈区。

int& Count()
{
   static int n = 0;
   n++;
   // ...

   return n;
}

那么使用下面代码会发生什么呢？

int& Add(int a, int b)
{
    int c = a + b;
    return c;
}

int main()
{
    int& ret = Add(1, 2);
    Add(3, 4);
    cout << "Add(1, 2) is :"<< ret <<endl;
    return 0;
}

我们发现第二次使用的Add函数时，ret的结果发生了改变。这里主要是因为两次都是使用的Add函数，开辟的空间是一样大，所以第一次使用函数的空间被第二次使用函数的空间所覆盖。原本是3的值，第二次进行访问的时候原位置是7了。

如果想象不出这个过程，通过图来理解：

我们这里只是一种情况，其实它有三种情况：(1)原来的值 (2)随机值 (3)被覆盖的值

int& Add(int a, int b)
{
	int c = a + b;
	return c;
}

int main()
{
	int& ret = Add(1, 2);
	cout << "Add(1, 2) is :" << ret << endl;
	cout << "Add(1, 2) is :" << ret << endl;
	Add(3, 4);
	cout << "Add(1, 2) is :" << ret << endl;
	return 0;
}

那么如何理解这三种情况呢？

其实很好理解，因为太贴近我们生活了。当你一个人去开房，走的时候发现你华为手机掉在房间了，然后你回去找，第一种情况：你找到了你自己的手机。第二种情况：阿姨打扫了，原来的地方没有你的手机，可能放在前台了。第三中情况：别人已经入住了，你原来放手机的位置放的是苹果手机（别人的）。

我们要记住这个是错误代码展示，只是让我们深入理解之后不在编写出这样的代码。

正确代码：

//方法一
int Add(int a, int b)
{
	int c = a + b;
	return c;
}
//方法二
int& Add(int a, int b)
{
	static int c = a + b;
	return c;
}

结论：

如果函数返回时，出了函数作用域，如果返回对象还在(还没还给系统)，则可以使用引用返回，如果已经还给系统了，则必须使用传值返回。

传值、传引用效率比较

以值作为参数或者返回值类型，在传参和返回期间，函数不会直接传递实参或者将变量本身直接返回，而是传递实参或者返回变量的一份临时的拷贝，因此用值作为参数或者返回值类型，效率是非常低下的，尤其是当参数或者返回值类型非常大时，效率就更低。

#include <time.h>
struct A{ 
	int a[10000];
};
void TestFunc1(A a){
}

void TestFunc2(A& a){
}

void TestRefAndValue(){
	A a;    // 以值作为函数参数    
	size_t begin1 = clock();  
	for (size_t i = 0; i < 10000; ++i)  
		TestFunc1(a);   
	size_t end1 = clock();
	// 以引用作为函数参数   
	size_t begin2 = clock();
	for (size_t i = 0; i < 10000; ++i)    
		TestFunc2(a); 
	size_t end2 = clock();
	// 分别计算两个函数运行结束后的时间  
	cout << "TestFunc1(A)-time:" << end1 - begin1 << endl;  
	cout << "TestFunc2(A&)-time:" << end2 - begin2 << endl;
}

int main()
{
	TestRefAndValue();

	return 0;
}

值和引用的作为返回值类型的性能比较

传值和指针在作为传参以及返回值类型上效率相差很大。

#include <time.h>
struct A{ int a[10000]; };

A a;// 值返回
A TestFunc1() {
	return a;
}
// 引用返回
A& TestFunc2(){
	return a;
}
void TestReturnByRefOrValue(){  
	// 以值作为函数的返回值类型    
	size_t begin1 = clock();    
	for (size_t i = 0; i < 100000; ++i)      
		TestFunc1();  
	size_t end1 = clock();
	// 以引用作为函数的返回值类型   
	size_t begin2 = clock();  
	for (size_t i = 0; i < 100000; ++i) 
		TestFunc2();   
	size_t end2 = clock();
	// 计算两个函数运算完成之后的时间   
	cout << "TestFunc1 time:" << end1 - begin1 << endl;  
	cout << "TestFunc2 time:" << end2 - begin2 << endl;
}

int main()
{
	TestReturnByRefOrValue();

	return 0;
}

引用和指针的区别

在语法概念上引用就是一个别名，没有独立空间，和其引用实体共用同一块空间。

int main(){
	int a = 10; 
	int& ra = a;
	cout << "&a = " << &a << endl; 
	cout << "&ra = " << &ra << endl;
	return 0;
}

在语法上，他们的地址都是一样的，所以共用一块空间。但是在底层实现上实际是有空间的，因为引用是按照指针方式来实现的。

int main(){
	int a = 10;
	int& ra = a; 
	ra = 20;
	int* pa = &a;
	*pa = 20;
	return 0;
}

引用和指针的语法对比图：

我们来看下引用和指针的汇编代码对比：

在底层引用与指针，当变量很小的时候都是用寄存器存储的，相当于开辟一块临时变量。

引用和指针的不同点:

引用概念上定义一个变量的别名，指针存储一个变量地址。

引用在定义时必须初始化，指针没有要求

引用在初始化时引用一个实体后，就不能再引用其他实体，而指针可以在任何时候指向任何一个同类型实体

没有NULL引用，但有NULL指针

在sizeof中含义不同：引用结果为引用类型的大小，但指针始终是地址空间所占字节个数(32

位平台下占4个字节)

引用自加即引用的实体增加1，指针自加即指针向后偏移一个类型的大小

有多级指针，但是没有多级引用

访问实体方式不同，指针需要显式解引用，引用编译器自己处理

引用比指针使用起来相对更安全

内联函数

在c语言中，我们为了解决调用函数不开辟栈帧，我们经常会使用到**宏，**但是使用宏是有缺陷的，1不能调试，2没有类型安全检查，3容易写错。为了解决这些问题c++就使用内联函数。

宏与内联的比较

#include <iostream>

#define Add(x,y) ((x)+(y))

inline int add(int x, int y)
{
	return x + y;
}

int main()
{
	int x = 10, y = 20;
	int ret = Add(x, y);
	int ret2 = add(x, y);

	printf("%d\n",ret);
	printf("%d\n", ret2);

	return 0;
}

概念

以inline修饰的函数叫做内联函数，编译时C++编译器会在调用内联函数的地方展开，没有函数调用建立栈帧的开销，内联函数提升程序运行的效率。

如果在上述函数前增加inline关键字将其改成内联函数，在编译期间编译器会用函数体替换函数的调用。

查看方式：

在release模式下，查看编译器生成的汇编代码中是否存在call Add
在debug模式下，需要对编译器进行设置，否则不会展开(因为debug模式下，编译器默认不会对代码进行优化，以下给出vs2013的设置方式)

特性

inline是一种以空间换时间的做法，如果编译器将函数当成内联函数处理，在编译阶段，会用函数体替换函数调用，缺陷：可能会使目标文件变大，优势：少了调用开销，提高程序运行效率。

展开会用更多的寄存器，空间就会变大，这样就会影响可执行程序的大小–安装包。

inline对于编译器而言只是一个建议，不同编译器关于inline实现机制可能不同，一般建议：将函数规模较小(即函数不是很长，具体没有准确的说法，取决于编译器内部实现)、不是递归、且频繁调用的函数采用inline修饰，否则编译器会忽略inline特性。

当函数长了之后展开会发声代码膨胀

inline不建议声明和定义分离，分离会导致链接错误。因为inline被展开，就没有函数地址了，链接就会找不到。

// F.h

#include <iostream>

using namespace std;

inline void f(int i);

// F.cpp

#include "F.h"

void f(int i)
{
 cout << i << endl;
}

// main.cpp

#include "F.h"

int main()
{
 f(10);
 return 0;
}

// 链接错误：main.obj : error LNK2019: 无法解析的外部符号 "void __cdecl 
f(int)" (?f@@YAXH@Z)，该符号在函数 _main 中被引用

auto关键字

随着程序越来越复杂，程序中用到的类型也越来越复杂，经常体现在：

1. 类型难于拼写

2. 含义不明确导致容易出错

#include <string>
#include <map>

int main()
{
 std::map<std::string, std::string> m{ { "apple", "苹果" }, { "orange", 

"橙子" }, 
   {"pear","梨"} };
 std::map<std::string, std::string>::iterator it = m.begin();
 while (it != m.end())
 {
 //....

 }
 return 0;
}

std::map::iterator 是一个类型，但是该类型太长了，特别容易写错。聪明的同学可能已经想到：可以通过typedef给类型取别名，比如：

#include #include

typedef std::mapstd::string, std::string> Map;

int main() {
 Map m{ 
           {
                 "apple", "苹果" },{ "orange", "橙子" }, {"pear","梨"} 
};

使用typedef给类型取别名确实可以简化代码，但是typedef有会遇到新的难题：在编程时，常常需要把表达式的值赋值给变量，这就要求在声明变量的时候清楚地知道表达式的类型。然而有时候要做到这点并非那么容易，因此C++11给auto赋予了新的含义。

auto简介

在早期C/C++中auto的含义是：使用**auto修饰的变量，是具有自动存储器的局部变量，**但遗憾的是一直没有人去使用它，大家可思考下为什么？

C++11中，标准委员会赋予了auto全新的含义即：auto不再是一个存储类型指示符，而是作为一个新的类型指示符来指示编译器，auto声明的变量必须由编译器在编译时期推导而得。

int TestAuto()
{
 return 10;
}

int main()
{
 int a = 10;
 auto b = a;
 auto c = 'a';
 auto d = TestAuto();
 
 cout << typeid(b).name() << endl;
 cout << typeid(c).name() << endl;
 cout << typeid(d).name() << endl;
 
 //auto e; 无法通过编译，使用auto定义变量时必须对其进行初始化

 return 0;
}

【注意】

使用auto定义变量时必须对其进行初始化，在编译阶段编译器需要根据初始化表达式来推导auto的实际类型。因此auto并非是一种“类型”的声明，而是一个类型声明时的“占位符”，编译器在编译期会将auto替换为变量实际的类型。

auto的使用细则

1. auto与指针和引用结合起来使用用auto声明指针类型时，用auto和auto*没有任何区别，但用auto声明引用类型时则必须加&

int main()
{
    int x = 10;
    auto a = &x;
    auto* b = &x;
    auto& c = x;
    cout << typeid(a).name() << endl;
    cout << typeid(b).name() << endl;
    cout << typeid(c).name() << endl;
    *a = 20;
    *b = 30;
     c = 40;
    return 0;
}

2. 在同一行定义多个变量当在同一行声明多个变量时，这些变量必须是相同的类型，否则编译器将会报错，因为编译器实际只对第一个类型进行推导，然后用推导出来的类型定义其他变量。

void TestAuto()
{
    auto a = 1, b = 2; 
    auto c = 3, d = 4.0;  // 该行代码会编译失败，因为c和d的初始化表达式类型不同

}

auto不能推导的场景

1. auto不能作为函数的参数

// 此处代码编译失败，auto不能作为形参类型，因为编译器无法对a的实际类型进行推导

void TestAuto(auto a)
{}

2. auto不能直接用来声明数组

void TestAuto()
{
    int a[] = {1,2,3};
    auto b[] = {4，5，6};
}

3. 为了避免与C++98中的auto发生混淆，C++11只保留了auto作为类型指示符的用法

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

没有任何区别，但用auto声明引用类型时则必须加&**

int main()
{
    int x = 10;
    auto a = &x;
    auto* b = &x;
    auto& c = x;
    cout << typeid(a).name() << endl;
    cout << typeid(b).name() << endl;
    cout << typeid(c).name() << endl;
    *a = 20;
    *b = 30;
     c = 40;
    return 0;
}

void TestAuto()
{
    auto a = 1, b = 2; 
    auto c = 3, d = 4.0;  // 该行代码会编译失败，因为c和d的初始化表达式类型不同

}

auto不能推导的场景

1. auto不能作为函数的参数

// 此处代码编译失败，auto不能作为形参类型，因为编译器无法对a的实际类型进行推导

void TestAuto(auto a)
{}

2. auto不能直接用来声明数组

void TestAuto()
{
    int a[] = {1,2,3};
    auto b[] = {4，5，6};
}

3. 为了避免与C++98中的auto发生混淆，C++11只保留了auto作为类型指示符的用法

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）
[外链图片转存中…(img-1vjqKxUQ-1713697650642)]