先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip204888 (备注大数据)
正文
std命名空间的使用惯例
在日常练习中,建议直接using namespace std即可,这样就很方便。
using namespace std展开,标准库就全部暴露出来了,如果我们定义跟库重名的类型/对 象/函数,就存在冲突问题。该问题在日常练习中很少出现,但是项目开发中代码较多、规模 大,就很容易出现。所以建议在项目开发中使用,像std::cout这样使用时指定命名空间 + using std::cout展开常用的库对象/类型等方式。
缺省参数
缺省参数概念
缺省参数是声明或定义函数时为函数的参数指定一个默认值 ,在调用该函数时,如果没有指定实参则采用该默认值,否则使用指定的实参。
#include <iostream>
using namespace std;
void Func(int a = 0)
{
cout << a << endl;
}
int main()
{
Func(); // 没有传参时,使用参数的默认值
Func(10); // 传参时,使用指定的实参
return 0;
}
说明:
使用c语言时,我们是不能给参数进行设置初始值的–语法要求;当我们使用时会出报错,参数的初始化错误。但是在c++中是可以的,相当于直接给函数的参数设置了一个初始值,当调用函数不传实参时就会得到我们设置的初始值。
缺省参数分类
1.全缺省参数
将全部参数设置初始值
#include <iostream>
using namespace std;
void Func(int a = 10, int b = 20, int c = 30)
{
cout << "a = " << a << endl;
cout << "b = " << b << endl;
cout << "c = " << c << endl;
}
int main()
{
Func();
Func(100);
Func(100,200);
Func(100,200,300);
return 0;
}
2.半缺省参数
将一部分参数设置初始值
void Func(int a, int b = 10, int c = 20)
{
cout << "a = " << a << endl;
cout << "b = " << b << endl;
cout << "c = " << c << endl;
}
int main()
{
//Func();//因为第一个参数没有设置初始值,所以第一个参数需要穿实参
Func(100);
Func(100,200);
Func(100,200,300);
return 0;
}
注意:
半缺省参数必须从右往左依次来给出,不能间隔着给
缺省值必须是常量或者全局变量
C语言不支持(编译器不支持)
缺省参数不能在函数声明和定义中同时出现
第4点说明
//a.h文件
void Func(int a = 10);
// a.cpp文件
void Func(int a = 20)
{}
// 注意:如果生命与定义位置同时出现,恰巧两个位置提供的值不同,那编译器就无法确定到底该
用那个缺省值。
函数重载
函数重载跟我们生活中一词多意很像,人们可以通过上下文或者语境来判断该词真实的含义,即该词被重载了。好比如你喜欢的女孩对你说:你很好!或者成为女朋友了对你说:我很好!
函数重载概念
是函数的一种特殊情况,C++允许在同一作用域中声明几个功能类似的同名函数,这些同名函数的形参列表(参数个数或类型或类型顺序)不同,常用来处理实现功能类似数据类型不同的问题。
1.参数类型不同
int Add(int left, int right)
{
cout << "int Add(int left, int right)" << endl;
return left + right;
}
double Add(double left, double right)
{
cout << "double Add(double left, double right)" << endl;
return left + right;
}
int main()
{
Add(10, 20);
Add(10.1, 20.2);
return 0;
}
2、参数个数不同
void f()
{
cout << "f()" << endl;
}
void f(int a)
{
cout << "f(int a)" << endl;
}
int main()
{
f();
f(10);
return 0;
}
3、参数类型顺序不同
void f(int a, char b)
{
cout << "f(int a,char b)" << endl;
}
void f(char b, int a)
{
cout << "f(char b, int a)" << endl;
}
int main()
{
f(10, 'a');
f('a', 10);
return 0;
}
C++支持函数重载的原理–名字修饰(name Mangling)
在这里我们必须知道这几过程:预处理、编译、汇编、链接。重拾:c–程序环境与预处理。首先我们知道预处理是将各个文件代码展开,然后把该替换的替换了,该删除的删除了。然后进入编译阶段,将c语言代码转换成汇编指针,在这过程中有词法分析,语法分析等。再这就汇编阶段,它将汇编代码转换为计算机认识的二进制指令,这里重点就是会生成符号表,符号表中有函数名和地址。
下面就是编译阶段,在linux下gcc环境和g++环境编译完成阶段的两端代码。
采用C语言编译器编译后结果 :
这里我们仔细观察得到,在linux下,采用gcc编译完成后,这里的函数名没有任何修饰,如果我们用两个相同的函数名,编译器是无法辨别的。
采用C++编译器编译后结果:
那么在linux下,采用g++编译完成后,我们发现函数是得到修饰的。**编译器将函数参 数类型信息添加到修改后的名字中。**这里好比两个红玫瑰苹果,一个是红玫瑰125克,一个是红玫瑰124克。他们都可以装在一个苹果篮子里,但是都能取分开。
我们在c++环境下,通过对函数名字的修饰((name Mangling),让相同的函数不同的功能得以实现。只要参数不同,修饰出来的名字就不一样,就支持了重载。但是不同系统函数修饰规则是有不同的。
在最后链接阶段,通过连接器(Linker)将所有二进制形式的目标文件和系统组件组合成一个可执行文件。
引用
引用概念
引用不是新定义一个变量,而是给已存在变量取了一个别名,编译器不会为引用变量开辟内存空 间,它和它引用的变量共用同一块内存空间。
这里就比好:蔡徐坤,在篮球上粉丝都爱称:“鸡,你太美”。其他方面上,粉丝亲切叫一声:“哥哥或者坤坤”。
类型& 引用变量名(对象名) = 引用实体;
#include <iostream>
void TestRef()
{
int a = 10;
int& ra = a;//<====定义引用类型
printf("%p\n", &a);
printf("%p\n", &ra);
}
int main()
{
TestRef();
return 0;
}
注意:引用类型必须和引用实体是同种类型的
引用特性
引用在定义时必须初始化
一个变量可以有多个引用
引用一旦引用一个实体,再不能引用其他实体
void TestRef()
{
int a = 10;
// int& ra; // (1)该条语句编译时会出错
int b = 20;
int& ra = a;
int& ra = b;//(3)报错:重定义;多次初始化
int& rra = a;
printf("%p %p %p\n", &a, &ra, &rra);
}
int main()
{
TestRef();
return 0;
}
常引用
const 类型 & 引用名;
**作用:**是不希望对所引用的内容进行修改。
void TestConstRef()
{
const int a = 10;
//int& ra = a; //(1) 该语句编译时会出错,a为常量
const int& ra = a;
// int& b = 10; //(2) 该语句编译时会出错,b为常量
const int& b = 10;
double d = 12.34;
//int& rd = d; // (3)该语句编译时会出错,类型不同
const int& rd = d;
}
解释:
出错1:
a被const修饰,a的权限被缩小,而这里却想将a的权限扩大,在操作系统中权限只能缩小,不能被扩大,解决办法const int& ra=a;
出错2:
引用的值必须为左值,b为常量。常量是一个真实值,可读,所以b为右值。那么左值相当于地址。因为这里b是在进行初始化,是一个临时对象。所以这里错误就是右值引用。右值进行引用的时候需要被const修饰,const int& b = 10;
右值引用简单理解,就是绑定到左值的引用,右值引用的特点是:它将让其所绑定的右值重获新生,即使该右值本身是一个临时变量,但是它本身却不能绑定任何左值。
错误3:
d为double类型,引用不能改变类型。那么这里加const让rd变成可读,相当于对d建立临时变量,以前我们遇到的截断,提升都属于通建立临时变量解决的问题的。
运用:
void func(const int& b)
{
cout << "b:" << &b << endl;
int c = b;
cout << "c:" << &c << endl;
c++;
cout << "c value" << c << endl;
}
int main()
{
int a = 10;
cout << "a:" << &a << endl;
func(a);
return 0;
}
可以看出a和b的地址一样,而c与b的地址不一样,可以修改c的值,但是无法修改b的内容。
使用场景
1.做参数
void Swap(int& left, int& right)
{
int temp = left;
left = right;
right = temp;
}
int main()
{
int a = 5, b = 6;
Swap(a,b);
cout << a <<" "<< b << endl;
return 0;
}
以前我们学习c语言是用的指针,现在我们学习c++就可以用引用替代,而且书写代码更加简洁。
2.做返回值
这里引用做返回值使用是就需要特别小心,因为会发生函数栈帧,当函数被销毁的时候,他原来的空间就会被覆盖,那么有可能会我们用得到的返回值,再去进行访问时就找到原来那个值。
列如:
这里使用static,返回值n是静态变量,存放的空间是在全局区(代码区)而不是栈区。
int& Count()
{
static int n = 0;
n++;
// ...
return n;
}
那么使用下面代码会发生什么呢?
int& Add(int a, int b)
{
int c = a + b;
return c;
}
int main()
{
int& ret = Add(1, 2);
Add(3, 4);
cout << "Add(1, 2) is :"<< ret <<endl;
return 0;
}
我们发现第二次使用的Add函数时,ret的结果发生了改变。这里主要是因为两次都是使用的Add函数,开辟的空间是一样大,所以第一次使用函数的空间被第二次使用函数的空间所覆盖。原本是3的值,第二次进行访问的时候原位置是7了。
如果想象不出这个过程,通过图来理解:
我们这里只是一种情况,其实它有三种情况:(1)原来的值 (2)随机值 (3)被覆盖的值
int& Add(int a, int b)
{
int c = a + b;
return c;
}
int main()
{
int& ret = Add(1, 2);
cout << "Add(1, 2) is :" << ret << endl;
cout << "Add(1, 2) is :" << ret << endl;
Add(3, 4);
cout << "Add(1, 2) is :" << ret << endl;
return 0;
}
那么如何理解这三种情况呢?
其实很好理解,因为太贴近我们生活了。当你一个人去开房,走的时候发现你华为手机掉在房间了,然后你回去找,第一种情况:你找到了你自己的手机。第二种情况:阿姨打扫了,原来的地方没有你的手机,可能放在前台了。第三中情况:别人已经入住了,你原来放手机的位置放的是苹果手机(别人的)。
我们要记住这个是错误代码展示,只是让我们深入理解之后不在编写出这样的代码。
正确代码:
//方法一
int Add(int a, int b)
{
int c = a + b;
return c;
}
//方法二
int& Add(int a, int b)
{
static int c = a + b;
return c;
}
结论:
如果函数返回时,出了函数作用域,如果返回对象还在(还没还给系统),则可以使用引用返回,如果已经还给系统了,则必须使用传值返回。
传值、传引用效率比较
以值作为参数或者返回值类型,在传参和返回期间,函数不会直接传递实参或者将变量本身直接返回,而是传递实参或者返回变量的一份临时的拷贝,因此用值作为参数或者返回值类型,效率是非常低下的,尤其是当参数或者返回值类型非常大时,效率就更低。
#include <time.h>
struct A{
int a[10000];
};
void TestFunc1(A a){
}
void TestFunc2(A& a){
}
void TestRefAndValue(){
A a; // 以值作为函数参数
size_t begin1 = clock();
for (size_t i = 0; i < 10000; ++i)
TestFunc1(a);
size_t end1 = clock();
// 以引用作为函数参数
size_t begin2 = clock();
for (size_t i = 0; i < 10000; ++i)
TestFunc2(a);
size_t end2 = clock();
// 分别计算两个函数运行结束后的时间
cout << "TestFunc1(A)-time:" << end1 - begin1 << endl;
cout << "TestFunc2(A&)-time:" << end2 - begin2 << endl;
}
int main()
{
TestRefAndValue();
return 0;
}
值和引用的作为返回值类型的性能比较
传值和指针在作为传参以及返回值类型上效率相差很大。
#include <time.h>
struct A{ int a[10000]; };
A a;// 值返回
A TestFunc1() {
return a;
}
// 引用返回
A& TestFunc2(){
return a;
}
void TestReturnByRefOrValue(){
// 以值作为函数的返回值类型
size_t begin1 = clock();
for (size_t i = 0; i < 100000; ++i)
TestFunc1();
size_t end1 = clock();
// 以引用作为函数的返回值类型
size_t begin2 = clock();
for (size_t i = 0; i < 100000; ++i)
TestFunc2();
size_t end2 = clock();
// 计算两个函数运算完成之后的时间
cout << "TestFunc1 time:" << end1 - begin1 << endl;
cout << "TestFunc2 time:" << end2 - begin2 << endl;
}
int main()
{
TestReturnByRefOrValue();
return 0;
}
引用和指针的区别
在语法概念上引用就是一个别名,没有独立空间,和其引用实体共用同一块空间。
int main(){
int a = 10;
int& ra = a;
cout << "&a = " << &a << endl;
cout << "&ra = " << &ra << endl;
return 0;
}
在语法上,他们的地址都是一样的,所以共用一块空间。但是在底层实现上实际是有空间的,因为引用是按照指针方式来实现的。
int main(){
int a = 10;
int& ra = a;
ra = 20;
int* pa = &a;
*pa = 20;
return 0;
}
引用和指针的语法对比图:
我们来看下引用和指针的汇编代码对比:
在底层引用与指针,当变量很小的时候都是用寄存器存储的,相当于开辟一块临时变量。
引用和指针的不同点:
引用概念上定义一个变量的别名,指针存储一个变量地址。
引用在定义时必须初始化,指针没有要求
引用在初始化时引用一个实体后,就不能再引用其他实体,而指针可以在任何时候指向任何一个同类型实体
没有NULL引用,但有NULL指针
在sizeof中含义不同:引用结果为引用类型的大小,但指针始终是地址空间所占字节个数(32
位平台下占4个字节)
引用自加即引用的实体增加1,指针自加即指针向后偏移一个类型的大小
有多级指针,但是没有多级引用
访问实体方式不同,指针需要显式解引用,引用编译器自己处理
引用比指针使用起来相对更安全
内联函数
在c语言中,我们为了解决调用函数不开辟栈帧,我们经常会使用到**宏,**但是使用宏是有缺陷的,1不能调试,2没有类型安全检查,3容易写错。为了解决这些问题c++就使用内联函数。
宏与内联的比较
#include <iostream>
#define Add(x,y) ((x)+(y))
inline int add(int x, int y)
{
return x + y;
}
int main()
{
int x = 10, y = 20;
int ret = Add(x, y);
int ret2 = add(x, y);
printf("%d\n",ret);
printf("%d\n", ret2);
return 0;
}
概念
以inline修饰的函数叫做内联函数,编译时C++编译器会在调用内联函数的地方展开,没有函数调 用建立栈帧的开销,内联函数提升程序运行的效率。
如果在上述函数前增加inline关键字将其改成内联函数,在编译期间编译器会用函数体替换函数的 调用。
查看方式:
-
在release模式下,查看编译器生成的汇编代码中是否存在call Add
-
在debug模式下,需要对编译器进行设置,否则不会展开(因为debug模式下,编译器默认不 会对代码进行优化,以下给出vs2013的设置方式)
特性
- inline是一种以空间换时间的做法,如果编译器将函数当成内联函数处理,在编译阶段,会 用函数体替换函数调用,缺陷:可能会使目标文件变大,优势:少了调用开销,提高程序运行效率。
展开会用更多的寄存器,空间就会变大,这样就会影响可执行程序的大小–安装包。
- inline对于编译器而言只是一个建议,不同编译器关于inline实现机制可能不同,一般建议:将函数规模较小(即函数不是很长,具体没有准确的说法,取决于编译器内部实现)、不是递归、且频繁调用的函数采用inline修饰,否则编译器会忽略inline特性。
当函数长了之后展开会发声代码膨胀
- inline不建议声明和定义分离,分离会导致链接错误。因为inline被展开,就没有函数地址 了,链接就会找不到。
// F.h
#include <iostream>
using namespace std;
inline void f(int i);
// F.cpp
#include "F.h"
void f(int i)
{
cout << i << endl;
}
// main.cpp
#include "F.h"
int main()
{
f(10);
return 0;
}
// 链接错误:main.obj : error LNK2019: 无法解析的外部符号 "void __cdecl
f(int)" (?f@@YAXH@Z),该符号在函数 _main 中被引用
auto关键字
随着程序越来越复杂,程序中用到的类型也越来越复杂,经常体现在:
1. 类型难于拼写
2. 含义不明确导致容易出错
#include <string>
#include <map>
int main()
{
std::map<std::string, std::string> m{ { "apple", "苹果" }, { "orange",
"橙子" },
{"pear","梨"} };
std::map<std::string, std::string>::iterator it = m.begin();
while (it != m.end())
{
//....
}
return 0;
}
std::map::iterator 是一个类型,但是该类型太长了,特别容 易写错。聪明的同学可能已经想到:可以通过typedef给类型取别名,比如:
#include #include
typedef std::mapstd::string, std::string> Map;
int main() {
Map m{
{
"apple", "苹果" },{ "orange", "橙子" }, {"pear","梨"}
};
使用typedef给类型取别名确实可以简化代码,但是typedef有会遇到新的难题: 在编程时,常常需要把表达式的值赋值给变量,这就要求在声明变量的时候清楚地知道表达式的 类型。然而有时候要做到这点并非那么容易,因此C++11给auto赋予了新的含义。
auto简介
在早期C/C++中auto的含义是:使用**auto修饰的变量,是具有自动存储器的局部变量,**但遗憾的 是一直没有人去使用它,大家可思考下为什么?
C++11中,标准委员会赋予了auto全新的含义即:auto不再是一个存储类型指示符,而是作为一 个新的类型指示符来指示编译器,auto声明的变量必须由编译器在编译时期推导而得。
int TestAuto()
{
return 10;
}
int main()
{
int a = 10;
auto b = a;
auto c = 'a';
auto d = TestAuto();
cout << typeid(b).name() << endl;
cout << typeid(c).name() << endl;
cout << typeid(d).name() << endl;
//auto e; 无法通过编译,使用auto定义变量时必须对其进行初始化
return 0;
}
【注意】
使用auto定义变量时必须对其进行初始化,在编译阶段编译器需要根据初始化表达式来推导auto的实际类型。因此auto并非是一种“类型”的声明,而是一个类型声明时的“占位符”,编译器在编 译期会将auto替换为变量实际的类型。
auto的使用细则
1. auto与指针和引用结合起来使用 用auto声明指针类型时,用auto和auto*没有任何区别,但用auto声明引用类型时则必须 加&
int main()
{
int x = 10;
auto a = &x;
auto* b = &x;
auto& c = x;
cout << typeid(a).name() << endl;
cout << typeid(b).name() << endl;
cout << typeid(c).name() << endl;
*a = 20;
*b = 30;
c = 40;
return 0;
}
2. 在同一行定义多个变量 当在同一行声明多个变量时,这些变量必须是相同的类型,否则编译器将会报错,因为编译 器实际只对第一个类型进行推导,然后用推导出来的类型定义其他变量。
void TestAuto()
{
auto a = 1, b = 2;
auto c = 3, d = 4.0; // 该行代码会编译失败,因为c和d的初始化表达式类型不同
}
auto不能推导的场景
1. auto不能作为函数的参数
// 此处代码编译失败,auto不能作为形参类型,因为编译器无法对a的实际类型进行推导
void TestAuto(auto a)
{}
2. auto不能直接用来声明数组
void TestAuto()
{
int a[] = {1,2,3};
auto b[] = {4,5,6};
}
3. 为了避免与C++98中的auto发生混淆,C++11只保留了auto作为类型指示符的用法
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
没有任何区别,但用auto声明引用类型时则必须 加&**
int main()
{
int x = 10;
auto a = &x;
auto* b = &x;
auto& c = x;
cout << typeid(a).name() << endl;
cout << typeid(b).name() << endl;
cout << typeid(c).name() << endl;
*a = 20;
*b = 30;
c = 40;
return 0;
}
2. 在同一行定义多个变量 当在同一行声明多个变量时,这些变量必须是相同的类型,否则编译器将会报错,因为编译 器实际只对第一个类型进行推导,然后用推导出来的类型定义其他变量。
void TestAuto()
{
auto a = 1, b = 2;
auto c = 3, d = 4.0; // 该行代码会编译失败,因为c和d的初始化表达式类型不同
}
auto不能推导的场景
1. auto不能作为函数的参数
// 此处代码编译失败,auto不能作为形参类型,因为编译器无法对a的实际类型进行推导
void TestAuto(auto a)
{}
2. auto不能直接用来声明数组
void TestAuto()
{
int a[] = {1,2,3};
auto b[] = {4,5,6};
}
3. 为了避免与C++98中的auto发生混淆,C++11只保留了auto作为类型指示符的用法
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
[外链图片转存中…(img-1vjqKxUQ-1713697650642)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!