Bootstrap

【C语言】结构体详解

目录

1.结构体类型的声明

1.1 结构体变量的创建和初始化

1.2 结构的特殊声明

1.3 结构体的自引用

2.结构体内存对齐

2.1 对齐规则

规则1

规则2

规则3

 对前三个规则的练习

规则4

2.2 为什么存在内存对齐

2.3 修改默认对齐数

3.结构体传参

4.结构体实现位段

4.1 什么是位段 

4.2位段的内存分配


在c语言中除了像int,char,float,long,double等本身支持的、现成的类型,也有自定义类型,比如说结构体struct、联合体union、枚举enum,接下来我们详细说一下结构体类型

1.结构体类型的声明

1.1 结构体变量的创建和初始化

结构是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量,下面是基本结构

struct tag
{
	member - list;  //成员,一个或多个
}variable-list;  //变量名

看不明白没关系,我们来举个例子,比如一个学生

struct student
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号

};//这里有分号,不能忘了

注意几点:

1.struct后面的student命名只要是符合语法的都可以 

2.分号前面、反大括号后面的variable-list可以不在此处创建变量,后面再创建,在此处创建的话就是全局结构体变量,后面再创建的话就是局部的结构体变量,如下

#include <stdio.h>

struct student
{
	char name[20];//姓名
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号

};

int main()
{
	struct student s1;  //s1为局部变量
	return 0;
}

或者

struct student
{
	char name[20];
	int age;
	char sex[5];
	char id[20];

}s1;//s1为全局变量

 这里很容易理解错误,误以为struct是变量类型,student是变量,其实并非这样

比如说你定义一个  int a;int是变量类型,a是变量,同理 struct student是结构体变量类型,s1才是结构体变量

再举个例子,比如一本书

struct book
{
	char name[20];//书名
	char author[20];//作者
	float price;//价格
    char id[10];//书号
}s2,s3,s4;

struct book是结构体变量类型,s2,s3,s4都是结构体变量,且是全局变量

当然也可以像下面这样定义,这时s2,s3,s4[5]是局部变量,s4[5]是结构体数组

#include <stdio.h>
struct book
{
	char name[20];//书名
	char author[20];//作者
	float price;//价格
    char id[10];//书号
};
int main()
{
	struct book s2;
    struct book s3;
	struct book s4[5];

	return 0;
}

变量创建好之后我们来进行初始化,以上面的struct book s2为例

struct book s2 = { "wodeshu","lingyangjiao",18.8,"A1010" };

 结构体初始化写在{}里面,书名、作者,书号是字符串,就用""初始化,价格是float类型,就直接写,中间用逗号隔开,我上面初始化的内容都是我随便写的,这种初始化是按照顺序依次初始化

也可以不按顺序,比如下面的代码

struct book s3 = { .id = "B2020",.author = "lingyangjiao",.name = "woxiedeshu",.price = 19.9 };

不按顺序的话就要用一个点(.)操作符来找结构体成员,然后用 = 赋值就行了,中间用逗号隔开 

如何将这些内容打印出来呢?接着往下看

#include <stdio.h>
struct book
{
	char name[20];//书名
	char author[20];//作者
	float price;//价格
	char id[10];//书号
};
int main()
{
	struct book s2 = { "wodeshu","lingyangjiao",18.8,"A1010" };
	printf("%s %s %f %s\n", s2.name, s2.author, s2.price, s2.id);
	return 0;
}

这是一种打印方法,用点(.)操作符: 结构体变量名.结构体成员

还有一种就是箭头(->)操作符: 结构体指针->结构体成员,如下,p是结构体指针

struct book* p = &s2;
printf("%s %s %f %s\n", p->name, p->author, p->price, p->id);

1.2 结构的特殊声明

在声明结构的时候可以不完全声明,叫匿名结构体类型

比如

//不匿名
struct s
{
	char c;
	int i;
	float f;
};

//匿名
struct 
{
	char c;
	int i;
	float f;
};

这样的话这个结构体没有名字,定义变量的时候就不可以像下面这样

struct s//正常情况
{
	char c;
	int i;
	float f;
};
struct //匿名情况
{
	char c;
	int i;
	float f;
};
int main()
{
	struct s S;//正常情况创建变量S
	struct S;//匿名结构体不可以这样创建S
	return 0;
}

应该像下面这样创建

struct //匿名情况
{
	char c;
	int i;
	float f;
}S;

同时可以对它进行初始化

struct //匿名情况
{
	char c;
	int i;
	float f;
}S = { 'x', 10, 3.14 };

打印出来看看

#include <stdio.h>
struct //匿名情况
{
	char c;
	int i;
	float f;
}S = { 'x', 10, 3.14 };
int main()
{
	printf("%c %d %f", S.c, S.i, S.f);
	return 0;
}

现在这个类型没有名字,匿名了,所以匿名结构体只能用一次 ,但不是销毁

现在我们来思考一个问题,下面的代码可以这样写吗?

#include <stdio.h>
struct 
{
	char c;
	int i;
	float f;
}s;
struct
{
	char c;
	int i;
	float f;
}* ps;
int main()
{
	ps = &s;
	return 0;
}

 答案是不可以的,因为这个匿名结构体没有名字,编译器无法确认s和指针ps类型是否一致

所以,匿名结构体是可以用的,也是存在的,但是使用很局限

1.3 结构体的自引用

大家可能或多或少听说过链表

我们把每一个框称为一个节点,这个节点不仅携带了值,还需要携带能找到下一个节点的信息,所以要把这样一个节点分为两部分,一部分存放值,一部分存放下一个结点的信息

存放下一个结点的信息时,可以像下面这样吗?

struct Node
{
	int a;
	struct Node next;
};

答案是不可以。为什么不可以呢?想一下这样包含的话 sizeof(struct Node)的大小是多少呢?自己包含自己,无穷下去,最终能算出结构体大小吗?不能。那我们应该怎么做?

既然我们只是为了找到下一个节点,那我们存放下一个节点的地址就好了,最后一个节点放空指针NULL

struct Node
{
	int a;//数据
	struct Node* next;//指针,大小为4个字节
};

 这样就实现了结构体自己包含自己,也就是结构体的自引用(匿名的结构体不能实现结构体的自引用

2.结构体内存对齐

 看下面的代码,s的大小是多少?

#include <stdio.h>
struct S
{
	char c1;
	int i;
	char c2;
};
int main()
{
	struct S s = { 0 };
	printf("%zd\n", sizeof(s));
	return 0;
}

char占1个字节,int占4个字节,char再占一个字节,大小为6,是不是呢?

显然不是,结果为12, 这是为什么呢? 接下来我们就说说结构体的内存对齐

2.1 对齐规则

规则1

结构体的第一个成员对齐到结构体变量起始位置偏移量为0的地址处

规则2

其他成员要对齐到某个数字(对齐数)的整数倍的地址处

  对齐数:编译器默认的对齐数 与 成员变量的大小的较小值

  --vs默认对齐数是8

  --Linux中gcc没有默认对齐数,所以对齐数就是成员自身大小

i的对齐数是4,从4的倍数的偏移量开始存4个字节,c2的对齐数是1,从1的倍数开始存1个字节

规则3

结构体总大小为结构体中所有成员对齐数的最大对齐数的整数倍 

s中的成员最大对齐数是成员i的对齐数,为4,所以结构体的大小为4的倍数,当前大小为9,不是4的倍数,往后数,直到12,是4的倍数,所以结构体大小为12个字节,打红色X的空间都是被浪费掉的,为什么要浪费,我们后面讨论

 对前三个规则的练习

1.算结构体大小

struct s2
{
	char c1;
	char c2;
	int i;
};

画图表示

结果是8个字节

2. 算结构体大小

struct s3
{
	double d;
	char c;
	int i;
};

依然是画图

为16个字节 

3.算结构体大小,这里的struct s3就是上一题的struct s3

struct s4
{
	char c1;
	struct s3 S;
	double d;
};

还是画图

c1放好之后,嵌套的结构体S应该怎么放呢?我们先来看看第4个规则 

规则4

如果结构体嵌套了结构体,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有对齐数的最大值(包括嵌套结构体的对齐数)的整数倍

S中的最大对齐数是8,所以S要对齐到8的倍数

那么这个结构体的大小是不是就是32呢?是的

2.2 为什么存在内存对齐

那么在设计结构体中,我们既要对齐,又节省空间的话,应该怎么做?

让占用空间小的成员尽量集中在一起

比如

struct s1
{
	char c1;
	int i;
	char c2;
};

struct s2
{
	char c1;
	char c2;
	int i;
};

虽然两个结构体成员完全一样,但是画图分析就可以知道内存区别

2.3 修改默认对齐数

用 #pragma 这个预处理指令,改变编译器的默认对齐数

没修改之前,下面这个代码结果应该为12,这个结构体的大小是12

#include <stdio.h>
struct S
{
	char c1;
	int i;
	char c2;
};
int main()
{
	printf("%zd", sizeof(struct S));
	return 0;
}

我们用 #pragma pack(n)修改默认对齐数,要修改的值n放在()里

#include <stdio.h>
#pragma pack(1) //默认对齐数设为1
struct S
{
	char c1;
	int i;
	char c2;
};
#pragma pack() //取消修改,括号中不放数

int main()
{
	printf("%zd", sizeof(struct S));
	return 0;
}

结果应该是6

3.结构体传参

现在需要写一个函数来打印结构体里面的内容,这个函数应该怎么传参?参数应该怎么设计?

#include <stdio.h>
struct S
{
	int arr[1000];
	int n;
	double d;
};
int main()
{
	struct S s = { {1,2,3,4,5},100,3.14 };//初始化
	printf1();//负责打印的函数
	return 0;
}

看下面的函数可以实现吗

void printf1(struct S t) //传值
{
	int i = 0;
	for (i = 0; i < 5; i++)
	{
		printf("%d ", t.arr[i]); //打印数组
	}
	printf("%d ", t.n);//打印n
	printf("%lf ", t.d);//打印d
}
printf1(s);

当代码运行起来的时候是可以打印出来的

但是,这是传值调用,这意味着S有多大空间,t就有多大空间,一个数组arr[1000]就占了4000个字节,而这么多的内存还要开辟两次,可想而知,很浪费空间,并且浪费时间,那怎么传呢?传地址过去就好了

printf2(&s);
void printf2(struct S * t)
{
	int i = 0;
	for (i = 0; i < 5; i++)
	{
		printf("%d ", t->arr[i]); //打印数组
	}
	printf("%d ", t->n);//打印n
	printf("%lf ", t->d);//打印d
}

用结构体指针t接收s的地址,聪明的同学已经发现,t的类型改为结构体指针后,打印结构体的时候操作符也变了,从 点(.)操作符: 结构体变量名.结构体成员  变成了 箭头(->)操作符: 结构体指针->结构体成员

所以,结构体传参的时候尽量传地址,如果害怕传址调用函数会改变结构体的值,在*前加一个const修饰就好了

void printf2(const struct S * t)

4.结构体实现位段

4.1 什么是位段 

位段是基于结构体的,位段的声明和结构类似,但有两点不同

1.位段成员必须是int(char)、unsigned int、signed int,在C99中位段成员类型也可以选项其他类型

2.位段成员名后面有一个冒号和数字,然后再加分号

比如

struct S1  //位段
{
	int _a : 2;
	int _b : 5;
	int _c : 10;
	int _d : 30;
};

struct S2  //结构体
{
	int _a;
	int _b;
	int _c;
	int _d;
};

这就是位段式的结构 ,成员名命名合法即可,不一定要加下划线(_)

在结构体s2中,一个int占4个字节,32个bit位,假如现在我们在成员_a中存放的值只有0、1、2、3这样的数,一个数就只占了两个bit位,给_a 32个bit位的话会浪费30个bit位。

位段式s1中  int _a : 2;  这句的意思就是,_a只占两个bit位,同理,_b就只占5个bit位,_c占10个bit位,_d就占30个bit位

位段的应用场景就是这种,指定成员所占bit位,节省内存

那么s1的大小现在是多少字节呢?思考一下,我们稍后揭示

4.2位段的内存分配

1.位段的空间上是按照需要,以4个字节(int)或1个字节(char)的方式开辟的,不够用再开辟

2.位段有很多不确定因素,不可跨平台

我们先来看一段代码

#include <stdio.h>
struct S
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};
int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	return 0;
}

 为了演示我们一次一次开辟空间,首先开辟第一个成员char应该占的字节大小,1个字节

开辟好之后,位段中 a占3个bit位,从这4个字节的左边先使用还是右边呢?在vs中默认是从右向左使用,如图

然后就存放b,b占4个bit位,这一个字节还剩下5个bit位,够b使用,继续存放在这个空间中,如图

现在还剩1个bit位,c需要5个bit位,这个剩下的1个空间浪费还是继续使用?在vs中,会浪费这1个bit位,并且再申请一个字节空间,如图

现在第二个字节还剩3个bit位,而d需要4个字节,还是一样,把这3个浪费掉,重新开辟一个字节,如图

现在成员内存空间就开辟完了,我们一共申请了3个字节

现在开始存放数据

我们把s1初始化为0了,现在里面的每个bit位都是0,我们一个一个看,先看a

a赋值为10,10的二进制数后8个为 00001010,但是a的位置只有3个bit位,只能存3个,存的是后3位,也就是 010 ,如图

b赋值为12,12的二进制数后8个为 00001100 ,b只有4个bit位,所以存1100,如图

c赋值为3,2的二进制数后8个为00000011,c有5个bit位,所以存00011,如图

d赋值为4,4的二进制数后8个是00000100,d有4个bit位,所以存0100,如图

其余位置放0

4个二进制位换一个16进制位,所以最后的结果用16进制表示就是0x620304

0110 0010 0000 0011 0000 0100 //二进制
6    2    0    3    0    4    //16进制

我们打开调试窗口看对不对

结果完全正确 

我们再回过头来看4.1中 s1 的内存

struct S1  
{
	int _a : 2;
	int _b : 5;
	int _c : 10;
	int _d : 30;
};

画图看看就可以知道,s1占了8个字节

本次分享就到这里,感谢阅读!

;