Bootstrap

C语言自定义类型结构体(24)


前言

  事实上,我们早就有过关于结构体的学习
  现在,我们再来深入理解它一下


一、结构体类型的声明

结构体回顾

  结构是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量

结构的声明

struct tag
{
  member-list;
}variable-list;

例如,我们想要描述一位学生:

struct Stu
{
  char name[20]; // 名字
  int age; // 年龄
  char sex[5]; // 性别
  char id[20]; // 学号
}; // 分号不能丢

结构体变量的创建和初始化
  运用大括号 { } 即可,在其里面进行初始化
  可以按照默认顺序初始化,也可以按照指定顺序初始化
  struct Stu s1 = {.age = 30, .name = “Lisi”, .sex = “nv”, .id = “2023020405”};

结构体的特殊声明

在声明结构的时候,可以不完全的声明

// 匿名结构体类型
// 只能使用一次
struct
{
	int a;
	char b;
	float c;
}x;

struct
{
	int a;
	char b;
	float c;
}a[20], *p;

我们可以思考一下,对于上面两个结构体, p = &x; 这样的语句对不对

答案是不对的,虽然两个结构体成员相同,但是因为是匿名的,在编译器看来是两种不同的类型
在这里插入图片描述

大部分情况下我们不会用到匿名结构体的,你在使用的时候也需要注意一下

结构体的自引用

  在结构中包含一个类型为该结构本身的成员是否可以呢?
  可以,我们之后学数据结构的链表就是如此,请持续关注我的博客!

在结构体自引用使用的过程中,夹杂了 typedef 对匿名结构体类型重命名,也容易引入问题

typedef struct
{
	int data;
	Node* next; // err
}Node;

答案是不行的,因为Node是对前面的匿名结构体类型的重命名产生的,但是在匿名结构体内部提前使用Node类型来创建成员变量,这是不行的,一言以蔽之就是,你提前使用了重命名类型

二、结构体的内存对齐

  现在我们要来深入探讨一个问题:结构体的大小计算
  其实也就是知识点 -> 内存对齐

先让你诧异一下,哈哈,就拿这两个输出作为引子吧!
在这里插入图片描述

对齐规则

结构体的对齐规则:

  1. 结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处
  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处
  3. 对齐数 = 编译器默认的一个对齐数 与 该变量成员大小的较小值
    - VS中默认的值为8
    - Linux中gcc没有默认对齐数,对齐数就是成员自身的大小
  4. 结构体总大小为最大对齐数(结构体中每个成员变量都有一个对齐数,所有对齐数当中最大的)整数倍
  5. 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍
struct S1
{
	char c1; // 1Byte
	char c2; // 1Byte
	int i; // 4Bytes
}

  我们会发现,起始c1放在偏移量为 0 的位置上,c2放在偏移量为1的位置上,而 int 占 4 个字节,取较小值得到对齐数是 4 ,对齐到 4 的整数倍的位置 4 上,并占 4 5 6 7 这四个位置,并且算下来整个结构体占据了 8 个字节,是最大对齐数 4 的整数倍,所以结构体的总大小为 8 ,浪费了 2 个字节的空间,图示如下:
在这里插入图片描述

我们再来看S2

struct S2
{
	char c1; // 1Byte
	int i; // 4Bytes
	char c2; // 1Byte
}

  c1先放在偏移量为 0 的位置上,而 int 占 4 个字节,对齐到整数位置 4 上,并占 4 5 6 7四个位置,而c2占在偏移量为8的位置上,这时候结构体的最大对齐数是4,而结构体的大小为0 ~ 8,为9,不是4的整数倍,因此还要再来 3 个字节,也就是 0 ~ 11,最终,会发现结构体的大小为 12 ,这其中就浪费了 6 个字节的内存空间,图示如下:
在这里插入图片描述

接下来我再给出一个例子,你用做练习自己分析吧

struct S3
{
	double d; // 0 ~ 7
	char c; // 8
	int i; // 12 ~ 15
};

答案是16个字节

那再来个嵌套结构体的:

struct S4
{
	char c1;
	struct S3 s3;
	double d;
};

  首先c1放在偏移量为0的位置上,而s3是个结构体,按照上述第五条规则,应该对齐到结构体成员中最大对齐数8的整数倍位置上,显然s3放在8上,并占 8 ~ 23位置,(s3大小为16,前面求过),这时候double放到对齐数8的整数倍上,刚好24满足,并占24~31位置,这样的话,S4大小为32,恰好也满足了所有成员中对齐数的整数倍这一必要性条件,浪费7个字节,图示如下:
在这里插入图片描述

如果你要验证,可以自己去写输出部分验证,或者可以打开内存监视
亦或者,有一个宏 offsetof ,可以用来计算结构体成员相较于起始位置的偏移量
需要注意的是,这个宏需要包含一个头文件 stddef.h
在这里插入图片描述

为什么存在内存对齐?

  1. 平台原因(移植原因)
    不是所有的硬件平台都能够访问任意地址上的任意数据;某些硬件平台只能在某些地址处获取某些特定类型的数据,否则则出现硬件异常
  2. 性能原因:
    数据结构(尤其是栈)应该尽量地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要两次内存访问,而对齐的内存访问只需要一次访问。假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证所有的double类型的数据都在对齐的地址中,那么就可以用一个内存操作来读取者写值了。否则,我们可能需要进行两次内存访问,因为对象可能分散在两个8字节内存块中。
    按图来说的话,性能原因如下:
    在这里插入图片描述

总而言之:结构体的内存对齐是拿空间来换时间的一种做法

所以在设计结构体的时候,我们既要满足对齐,又要节省空间的话,可以考虑将占用内存小的成员尽量集中在一起
比如上述的 S1 和 S2 结构体,S1 设计的就比 S2 好

修改默认对齐数

#pragma 这个预处理指令,可以改变编译器的默认对齐数

#include <stdio.h>  
#pragma pack(1) //设置默认对齐方式为1  
struct S  
{  
    char c1;  
    int i;  
    char c2;  
};  
#pragma pack() //取消设置的对齐,恢复默认  
int main()  
{  
    //输出的结果是什么?  
    printf("%d\n", sizeof(struct S));  
    return 0;  
}

答案是6,自行分析
当我们觉得对齐方式不合理的时候,我们可以自己更改默认对齐数

三、结构体传参

#include <stdio.h>

struct S
{
    int data[1000];
    int num;
};

struct S s = { {1,2,3,4}, 1000 };
//结构体传参  
void print1(struct S s)
{
    printf("%d\n", s.num);
}

//结构体地址传参  
void print2(struct S* ps)
{
    printf("%d\n", ps->num);
}

int main()
{
    print1(s); //传结构体  
    print2(&s); //传地址  
    return 0;
}

  上面 printf1 和 printf2 函数哪个好些?
  printf2的方式更好一些,也就是说传地址方式更好一些,本质上还是因为形参是实参的一份拷贝,太浪费内存空间了

四、结构体实现位段

  你可能只听说过段位,没事,现在我来跟你讲一下位段
  没听过很正常,这个知识点比较细致,但是对于了解底层以及未来网络的学习还是很有用的

什么是位段

 位段的声明和结构是类似的,有两个不同:

  1. 位段的成员必须是int、unsigned int或 signed int,在C99中位段成员的类型也可以选择其他类型
  2. 位段的成员名后边有一个冒号和一个数字
struct A
{
	int _a:2;
	int _b:5;
	int _c:10;
	int _d:30;
}// A就是一个位段类型

那么位段A所占内存的大小是多少?
在这里插入图片描述

为什么不是按照前面讲述的内存对齐,是16反而是8?

位段的内存分配

位段的出现就是为了节省空间

  1. 位段的成员可以是 int、unsigned int、signed int 或者是 char 等类型。
  2. 位段的空间上是按照需要以 4 个字节(int)或者 1 个字节(char)的方式来开辟的。
  3. 位段有很多不确定因素,位段是不跨平台的,注意可移植的程序应避免使用位段。(比如说一个字节从左向右还是从右向左使用?)

假设从右向左,来个例子如下:
在这里插入图片描述
  _a给两个比特位,_b给5个比特位,_c给10个比特位,_d给30个比特位
  _a、_b、_c没什么好说的,但是这个_d就有两种存储方式了,是直接弃掉第一个 int 剩下的15个比特位,新开一个 int 用30个比特位存_d ;还是继续使用完这15个比特位,再新开个 int 用15个存_d,其实,C语言也没有规定,完全取决于编译器,哈哈,这又是不确定性

VS下其实是从右向左存储,如果剩余的空间不够下一个成员使用,就新开空间并浪费
我们来通过下面这段代码来进行验证:

#include <stdio.h>

struct S
{
	// char就好在是一个字节一个字节开辟
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};

int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;

	printf("%zd", sizeof(struct S)); // 3
	return 0;
}

首先,a 和 b共占用了7个比特位,剩下1个比特位不够 c ,于是新开一个字节放 c,同理再新开一个字节放 d
在这里插入图片描述
接下来我们给 a 赋值为 10,即1010,截断后三位,放入010,同理b放入1100

这时候,第一个字节的8个比特位就是01100010

同理c放入00011

这时候,第二个字节的8个比特位就是00000011

同理d放入0100

这时候,第三个字节的8个比特位就是00000100

那么,按照十六进制位,这三个字节就是分别就是 0x62、0x03、0x04,打开内存!
在这里插入图片描述

果然如此!!

位段的跨平台问题

  1. int 位段被当成有符号数还是无符号数是不确定的
  2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。)
  3. 位段中的成员在存储中有右分配,还是从右向左分配标准尚未定义。
  4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位置,是含有剩余的位置是利用,这是不确定的。

位段的应用

  同开头所说,位段在于网络传输部分还是用处蛮大的
  这个自行了解,我也是现查的,具体原理大家自辨

位段使用的注意事项

  位段的几个成员共享同一个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位段处是没有地址的。内存中每个字节分配一个地址,一个字节内部的bit位是没有地址的。

  所以不能对位段的成员使用&操作符,这样就不能使用scanf直接给位段的成员输入值,只能是先输入放在一个变量中,然后赋值给位段的成员。

struct A  
{  
    int _a : 2;  
    int _b : 5;  
    int _c : 10;  
    int _d : 30;  
};  

int main()  
{  
    struct A sa = {0};  
    scanf("%d", &sa._b); // error
    
    // right 
    int b = 0;  
    scanf("%d", &b);  
    sa._b = b;  
    return 0;  
}

总结

  我也没想到结构体深入了解竟然能讲出那么多东西来,哈哈
  本篇还是比较难的,请你和我好好消化一下,准备接下来的学习~

;