Bootstrap

c语言操作符万字超详解


1. 操作符分类

算术操作符: +  -  *  /  %
移位操作符: << >>
位操作符: & | ^
赋值操作符: =  +=   -=  *= /=  %=  <<=  >>=  &=  |=  ^=
单目操作符: ! ++ -- & * + - ~  sizeof(类型)
关系操作符: >  >=  <  <=   ==   !=
逻辑操作符: &&  ||
条件操作符: ? :
逗号表达式: ,
下标引用: []
函数调用: ()
结构成员访问: .  ->

上面的操作符中,算术操作符、赋值操作符、逻辑操作符、条件操作符和一些单目操作符已经在之前的博客中有所提及,这里就不再赘述了。

2. 二进制和进制转换

一些操作符涉及到二进制,因此我们先介绍一下进制转换。

我们经常能听到 2进制、8进制、10进制、16进制 这样的讲法,那是什么意思呢?
其实2进制、8进制、10进制、16进制只是数值的不同表示形式而已。
比如:数值15的各种进制的表示形式:

15的2进制:1111
15的8进制:17
15的10进制:15
15的16进制:F

注:

16进制的数值之前写:0x
8进制的数值之前写:0

我们重点介绍一下二进制
首先我们还是得从10进制讲起,因为10进制是我们生活中经常使用的,因此我们已经形成了很多常识:

10进制中满10进1
10进制的数字每一位都是0~9的数字组成

其实二进制也是一样的

2进制中满2进1
2进制的数字每一位都是0~1的数字组成

那么 1101 就是二进制的数字了。

二进制转十进制

10进制的123表示的值是一百二十三,为什么是这个值呢?其实10进制的每一位是有权重的,10进制的数字从右向左是个位、十位、百位…,分别每一位的权重是 100,101,102
十进制
其实二进制与十进制是一致的,只不过二进制每一位的权重依次变为20,21,22……
二进制
十进制转二进制可以使用短除法
短除法

二进制转八进制

八进制的数字每一位是0-7的,0-7的数字,各自写成二进制,最多有3个二进制位就足够了,比如7的二进制是111,所以在二进制转八进制数的时候,从二进制序列中右边低位开始向左每3个二进制位会换算一个八进制位,剩余不够3个二进制位的直接换算。
二转八

二进制转十六进制

其实与转八进制是同理的
二转十六
当然需要注意的是:16进制前面要加 0x 。

3. 原码,反码,补码

整数的2进制表示方法有三种,即原码反码补码

有符号整数的三种表示方法均有符号位和数值位两部分,2进制序列中,最高位的1位是被当做符号位,剩余的都是数值位

符号位都是用0表示,用1表示

正整数的原、反、补码都相同。

负整数的三种表示方法各不相同。
原码:直接将数值按照正负数的形式翻译成二进制得到的就是原码。
反码:将原码的符号位不变,其他位依次按位取反就可以得到反码。
补码:将反码加一得到的就是补码。

那么从原码得到补码的方式就是取反加一
从补码得到原码的方式就是加一取反,但实际上由于是二进制,所以对补码取反加一也能得到原码。

对于整形来说:数据存放内存中其实存放的是补码
为什么呢?

在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;
同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,
不需要额外的硬件电路。

4. 移位操作符

<< 左移操作符
>> 右移操作符

注意:移位操作符操作的对象只能是整数。

左移操作符

规则:左边舍弃,右边补0

#include<stdio.h>
int main()
{
	int a = 10;
	int b = a << 1;
	printf("%d ", a);
	printf("%d ", b);
	return 0;
}

左移操作符
左移操作符
想一想,如果将上面代码中的 10 改成 -10 的话,结果会变为多少?
左移操作符
由此我们可以得出“左移操作符不会改变符号”的结论吗?
我们不妨来分析一下这个*-20*是怎么得出来的。

-20
那我们不妨改一改被操作数的数值:-2147483647

这是一个接近 int 极限的数值,那么它被左移一次会得到什么呢?
极限举例
答案是 2,虽然这个数不容易分析,但我们仍然能得到结论:符号位也是会被抛弃的
还有另一个例子:
极限举例2

右移操作符

移位规则:右移运算分两种:

1. 逻辑右移:左边用0填充,右边丢弃
2. 算术右移:左边用原该值的符号位填充,右边丢弃

我们用一个例子来解释这两种运算:

#include<stdio.h>
int main()
{
	int num = -1;
	int n = num >> 1;
	printf("num=%d\n", num);
	printf("n=%d\n", n);
	return 0;
}

逻辑右移:
逻辑右移
算术右移:
算术右移
而究竟采用哪种右移方式,这是c语言标准未明确规定的,因此,具体实现取决于编译器
不过,大部分的编译器比如vs2022,采用的都是算术右移
vs环境下的右移
注意:对于移位运算符,不要移动负数位,这个是标准未定义的。

int n = 10;
n>>-1;//这是错误的

5. 位操作符

概念

位操作符有以下4种:

& //按位与
| //按位或
^ //按位异或
~ //按位取反

注意:它们的操作数都必须是整数!!
使用方式如下:

#include<stdio.h>
int main()
{
	int a = 10;
	int b = 5;
	int c = a & b;//前种操作符都是这样的二元操作符,不再一一列举
}
#include<stdio.h>
int main()
{
	int a = 1;
	int b = ~a;
	printf("%d", b);
	return 0;
}

这4个操作符都是在对整数存储在内存中的补码进行的操作。

& 指如果两个操作数补码的同一位数字均为1,则操作产生的结果的这一位为1,否则为0
| 指如果两个操作数补码的同一位数字有一个为1,则操作产生的结果的这一位为1,否则为0
^ 指如果两个操作数补码的同一位数字相同,则操作产生的结果的这一位为0,否则为1
~ 指结果的补码的每一位数字都与操作数相反

分析
测试

练习

练习一

不能创建临时变量(第三个变量),实现两个整数的交换。
这里我们需要用到两个结论:

1. ^ 操作符适用交换律
2. ^ 操作符两边数字相同,结果为0

基于上述两条结论,我们可以尝试解答上面的问题:

#include<stdio.h>
int main()
{
	int a = 10;
	int b = 20;
	a = a ^ b;
	b = a ^ b; //这里按原数字分析: b = a ^ b ^ b = a
	a = a ^ b; //这里按原数字分析: a = a ^ b ^ a = b
	printf("a = %d,b = %d", a, b);
	return 0;
}

这样就能在不创建临时变量的情况下交换两个整形变量了。
但请注意,这样的方法相较于创建临时变量进行交换,性能开销是比较大的,因此,在正常情况下,更推荐使用创建临时变量的方式进行交换。

练习二

求一个整数存储在内存中的二进制中1的个数。
看到这一题,我们能很快写出下面的代码:

#include<stdio.h>
int main()
{
	int num = 10;//以10为例
	int count = 0;
	while (num)
	{
		if (num % 2 == 1)
			count++;
		num /= 2;
	}
	printf("%d", count);
	return 0;
}

诈一看这个式子好像能完成题目要求,但是如果num负数,还能得到正确的答案吗?

我们可以通过操作符对上面的代码进行优化:

#include<stdio.h>
int main()
{
	int num = -1;
	int count = 0;
	for (int i = 0; i < 32; i++)//循环遍历num的补码的每一位
	{
		if (num & 1)//如果num的最后一位为1,那么表达式为1
			count++;
		num >>= 1;//num右移一位
	}
	printf("%d", count);
	return 0;
}

那么这个代码就可以计算负数的补码中1的个数了。

但是,想一想,这个代码无论num中有多少个1,都会运行32次,在这里有没有可以进一步优化的地方呢?
我们先来分析一下这个代码的结果:

num = num & (num - 1)

我们先假设num为10,来分析一下
分析2
可以看出来,这个代码的结果是使num的补码中少一位最低的1,那么利用这一点,我们就可以写出更好的代码来解决这个问题了:

#include<stdio.h>
int main()
{
	int num = -1;//想一想,当num为负数时,它还能得到正确的答案吗?
	int count = 0;
	while (num)
	{
		count++;
		num = num & (num - 1);
	}
	printf("%d", count);
	return 0;
}

练习三

二进制位置0或者置1
编写代码将13二进制序列的第5位修改为1,然后再改回0

13的2进制序列: 00000000000000000000000000001101
将第5位置为1后:00000000000000000000000000011101
将第5位再置为0:00000000000000000000000000001101
#include<stdio.h>
int main()
{
	int num = 13;
	num = num | (1 >> 4);
	num = num ^ (1 >> 4);
	//变回去的这一步还可以写成:
	//num = num & ~(1 >> 4);
	printf("%d", num);
	return 0;
}

6. 单目操作符

单目操作符有:

!、++、--、&、*、+、-、~ 、sizeof、(类型)
//(类型)这个操作符是强制类型转换

单目操作符的特点是只有一个操作数,单自操作符中只有&和*没有介绍,这两个操作符都是与指针有关的,放到指针的博客中进行介绍。

7. 逗号表达式

expl,exp2,exp3,……expN

这就是逗号表达式的基本格式
逗号表达式,就是用逗号隔开的多个表达式。
从左向右依次执行,整个表达式的结果是最后一个表达式的结果

练习

练习一:

int a = 1;
int b = 2;
int c = (a>b, a=b+10, a, b=a+1);//逗号表达式
//c是多少?

逗号表达式从左向右依次进行,结果依次是:
1,12(注意这里将a赋值为12了),12,13
逗号表达式整个表达式的结果是最后一个表达式的结果,所以c为13

练习二:
用逗号表达式改写下面的循环语句:

int a;
//对a赋值
a = get_val();
count_val(a);
while (a > 0)
{
	//业务处理
	//...
	a = get_val();
	count_val(a);
}

可以发现,每次循环开始前都会进行两次函数的调用再进行业务处理,那么就有:

while (a = get_val(), count_val(a), a > 0)
{
	//业务处理
}

8. 下标访问[]、函数调用()

下标引用操作符

int arr[10];//创建数组
arr[9]= 10;//实用下标引用操作符。
//[]的两个操作数是arr和9。

既然知道了[]的两个操作数为arr和9,那么这两个操作数有先后之分吗,我们来写一个古怪的代码测试一下:

#include<stdio.h>
int main()
{
	int arr[2] = { 2,3 };
	printf("%d %d", 0[arr],1[arr]);//这里略显古怪
	return 0;
}

结果
很显然,这里得到了正确的结果,这说明[]操作符的两个操作数是没有先后之分的,当然,并不建议在实际开发中写下这样的代码!
这样写也能生效的具体原因,我会在指针的博客中说明。

函数调用操作符

接受一个或者多个操作数,第一个操作数是函数名,剩余的操作数就是传递给函数的参数。

#include <stdio.h>
void test1()
{
	printf("hehe\n");
}
void test2(const char* str)
{
	printf("%s\n", str);
}
int main()
{
	test1(); //这⾥的()就是作为函数调⽤操作符。
	test2("hello bit.");//这⾥的()就是函数调⽤操作符。
	return 0;
}

函数已经在前面的博客中详细介绍了,这里不再过多赘述。

9. 结构成员访问操作符

结构体

C语言已经提供了内置类型,如:char、short、int、long、float、double等,但是只有这些内置类型还是不够的,假设我想描述学生,描述一本书,这时单一的内置类型是不行的。
描述一个学生需要名字、年龄、学号、身高、体重等;
描述一本书需要作者、出版社、定价等。
C语言为了解决这个问题,增加了结构体这种自定义的数据类型,让程序员可以自己创造适合的类型。

结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量、标量、数组、指针,甚至是其他结构体

结构体的声明

结构体声明的基本结构为:

struct tag
{
	member - list;
}variable - list;

举例:
比如说上面的学生:

struct Stu
{
 	char name[20];//名字
 	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
}; //分号不能丢

结构体变量的定义和初始化

定义:

struct Point
{
	int x;
	int y;
}p1,p2; //声明类型的同时定义变量p1,p2
struct Point p3; //定义结构体变量p3

初始化:

struct Point p3 = { 10, 20 };
struct Stu //类型声明
{
	char name[15];//名字
	int age; //年龄
};
struct Stu s1 = { "zhangsan", 20 };//初始化
struct Stu s2 = { .age = 20, .name = "lisi" };//指定顺序初始化

结构体嵌套初始化:

struct Node
{
	int data;
	struct Point p;
	struct Node* next;
}n1 = { 10, {4,5}, NULL }; //结构体嵌套初始化
struct Node n2 = { 20, {5, 6}, NULL };//结构体嵌套初始化

注意嵌套初始化里的{}不要写成(),否则会被认为是逗号表达式

结构体成员访问操作符

直接访问

结构体成员的直接访问是通过 . 这个操作符实现的,这个操作符有两个操作数,举个例子:

#include <stdio.h>
struct Point
{
	int x;
	int y;
}p = { 1,2 };
int main()
{
	printf("x: %d y: %d\n", p.x, p.y);//这里用到了. 操作符
	return 0;
}

使用方式:结构体变量.成员名

间接访问

有时候我们得到的不是一个结构体变量,而是得到了一个指向结构体的指针。如下所示:

#include <stdio.h>
struct Point
{
	int x;
	int y;
};

int main()
{
	struct Point p = { 3, 4 };
	struct Point* ptr = &p;
	ptr->x = 10;
	ptr->y = 20;
	printf("x = %d y = %d\n", ptr->x, ptr->y);//这里使用->操作符
	return 0;
}

注:-> 即一个负号-和一个大于号>
使用方式:结构体指针->成员名

合并测试:

#include <stdio.h>
#include <string.h>
struct Stu
{
	char name[15];//名字
	int age; //年龄
};
void print_stu(struct Stu s)
{
	printf("%s %d\n", s.name, s.age);
}
void set_stu(struct Stu* ps)
{
	strcpy(ps->name, "李四");//strcpy是一个库函数,作用是将"李四"放进ps->name里
	ps->age = 28;}
int main()
{
	struct Stu s = { "张三", 20 };
	print_stu(s);
	set_stu(&s);
	print_stu(s);
	return 0;
}

这里为了介绍结构体成员访问操作符,对结构体进行了一些基本的解释,关于结构体的更多内容会在将来的博客中详细解释。

10. 操作符的属性:优先级、结合性

优先性

优先级指的是,如果一个表达式包含多个运算符,哪个运算符应该优先执行。各种运算符的优先级是不一样的。

3 + 4 * 5;

上面示例中,表达式3 + 4 * 5 里面既有加法运算符(+),又有乘法运算符(*)。由于乘法
的优先级高于加法,所以会先计算4 * 5,而不是先计算3 + 4。

结合性

如果两个运算符优先级相同,优先级没办法确定先计算哪个了,这时候就看结合性了,则根据运算符是左结合,还是右结合,决定执行顺序。大部分运算符是左结合(从左到右执行),少数运算符是右结合(从右到左执行),比如赋值运算符(=)。

5 * 6 / 2;

上面示例中,* 和 / 的优先级相同,它们都是左结合运算符,所以从左到右执行,先计算5 * 6,
再计算 /2。
运算符的优先级顺序很多,下面是部分运算符的优先级顺序(按照优先级从高到低排列),建议大概
记住这些操作符的优先级就行,其他操作符在使用的时候查看下面表格就可以了。

• 圆括号( () )
• 自增运算符( ++ ),自减运算符( -- )
• 单目运算符( + 和 - )
• 乘法( * ),除法( / )
• 加法( + ),减法( - )
• 关系运算符( < 、 > 等)
• 赋值运算符( = )

由于圆括号的优先级最高,可以使用它改变其他运算符的优先级。
其他操作符

前缀 ++ 与 -- 的运算数不能是转型。此规则在文法上禁止某些表达式本来也会在语义上非法的表达式。
某些编译器忽略此规则并检测语义上的非法。

sizeof 的运算数不能是类型转型:表达式 sizeof (int) * p 无歧义地转译成 (sizeof(int)) * p ,
而非 sizeof((int)*p) 。

条件运算符中部(? 与 : 之间)的表达式分析为如同加括号:忽略其相对于 ?: 的优先级。
赋值运算符的左运算数必须是一元(第 2 级非转型)表达式。
此规则在文法上禁止某些表达式本来也会在语义上非法的表达式。
从而许多编译器忽略此规则并在语义上检测其非法。
例如, e = a < d ? a++ : a = d 是因此规则而无法剖析的表达式。
然而许多编译器忽略此规则并将它剖析成 e = ( ((a < d) ? (a++) : a) = d ),并给出错误,
因为它在语义上非法。

分析表达式时,列于上面表中某行的运算符,将比列于低于它的行中拥有较低优先级的任何运算符,
更紧密地绑定到其参数(如同用括号)。例如,表达式 *p++ 被分析为 *(p++),而非 (*p)++。
拥有相同优先级的运算符以其结合性的方向绑定到其参数。
例如表达式 a=b=c 被分析为 a=(b=c) 而非 (a=b)=c,因为从右到左结合性。

注解

优先级和结合性与求值顺序相互独立。(这也就是文末的大部分错误表达式的错误原因)
标准自身并未指定优先级。它们是从文法中导出的。
结合性规定对于一元运算符是冗余的,且只为完备而显示:一元前缀运算符始终从右到左结合
(sizeof ++*p 为 sizeof(++(*p)))而一元后缀运算符始终从左到右结合(a[1][2]++ 为 ((a[1])[2])++)。
注意结合性对成员访问运算符有意义,即使在它们与一元后缀运算符组合时:
a.b++ 分析为 (a.b)++ 而非 a.(b++)

来源:C 运算符优先级

11. 表达式求值

整形提升

C语言中整型算术运算总是至少以缺省(默认)整型类型的精度来进行的。
为了获得这个精度,表达式中的字符短整型操作数在使用之前被转换为普通整型,这种转换称为整型提升。

整形提升的意义:

表达式的整型运算要在CPU的相应运算器件内执行,CPU内整型运算器(ALU)的操作数的字节长度一般就是int的字
节长度,同时也是CPU的通用寄存器的长度。
因此,即使两个char类型的相加,在CPU执行时实际上也要先转换为CPU内整型操作数的标准长度。
通用CPU(general-purpose CPU)是难以直接实现两个8比特字节直接相加运算(虽然机器指令中可能有这种字节
相加指令)。所以,表达式中各种长度可能小于int长度的整型值,都必须先转换为int或unsignedint,然后才能
送入CPU	去执行运算。

如何进行整形提升?

1. 有符号整数提升是按照变量的数据类型的符号位来提升的
2. 无符号整数提升,高位补0

负数:

char cl = -1;
变量c1的二进制位(补码)只有8个比特位
1111111
因为 char 为有符号的 char
所以整形提升的时候,高位补充符号位,即为1
提升之后的结果是:
11111111111111111111111111111111

正数:

//正数的整形提升
char c2 = 1;
变量c2的二进制位(补码)中只有8个比特位:
00000001
因为 char 为有符号的 char
所以整形提升的时候,高位补充符号位,即为
提升之后的结果是:
00000000000000000000000000000001

无符号整数在整形提升时高位补0

算数转换

如果某个操作符的各个操作数属于不同的类型,那么除非其中一个操作数的转换为另一个操作数的类型,否则操作就无法进行。下面的层次体系称为寻常算术转换。

long double
double
float
unsigned long int
long int
unsigned int
int

如果某个操作数的类型在上面这个列表中排名靠后,那么首先要转换为另外一个操作数的类型后执行运算。
算数转换可以分为自动类型转换强制类型转换。‌自动类型转换是编译器自动隐式地进行的数据类型转换,‌不需要程序员干预。‌例如,‌ char 型和 short 参与运算时,‌必须先转换成 int 型。‌强制类型转换则是程序员明确提出的类型转换,‌需要通过特定的格式的代码(就是强制类型转换操作符)来指明。‌
注意:所有的浮点运算都是以双精度型进行的,‌即使仅含float单精度数运算的表达式,‌也要先转换成都double型,‌再做运算。‌char型和short型参与运算时,‌必须先转换成int型。

12. 一些错误的表达式

表达式一

a * b + c * d + e * f

表达式1在计算的时候,由于*的优先级比+高只能保证 * 的运算比+早,但是优先级并不
能决定第三个 * 比第一个+早执行。
所以表达式的计算机顺序就可能是:

a*b
c*d
a*b + c*d
e*f
a*b + c*d + e*f

或是

a*b
c*d
e*f
a*b + c*d
a*b + c*d + e*f

如果a,b,c,d是含有一些相同变量的表达式,且在这些表达式中这些变量的值发生了变化,那么就会导致产生不同的结果。

表达式二

c + --c;

同上,操作符的优先级只能决定自减 – 的运算在 +的运算的前面,但是我们并没有办法得知,+ 操作符的左操作数的获取在右操作数之前还是之后求值,所以结果是不可预测的,是有歧义的。

表达式三

int main()
{
 	int i = 10;
 	i = i-- - --i * ( i = -3 ) * i++ + ++i;
 	printf("i = %d\n", i);
	return 0;
}

很标准的……
错误原因也和上面的一样。
表达式三在不同编译器中测试结果:
测试结果

表达式四

#include <stdio.h>
int fun()
{
	 static int count = 1;
	 return ++count;
}

int main()
{
	 int answer;
	 answer = fun() - fun() * fun();
	 printf( "%d\n", answer);//输出多少?
	 return 0;
}

虽然在大多数的编译器上求得结果都是相同的。
这个代码实际上是有问题的!

上述代码 answer = fun()- fun()* fun();中我们只能通过操作符的优先级得知:先算乘法,再算减法。
但是函数的调用先后顺序无法通过操作符的优先级确定。

表达式五

#include <stdio.h>
int main()
{
	 int i = 1;
	 int ret = (++i) + (++i) + (++i);
	 printf("%d\n", ret);
	 printf("%d\n", i);
	 return 0;
}

这串代码在gcc编译器中的结果为10和4,但在vs2022中为12和4。
不妨分析一下,这两个结果都是如何得出来的。

因此:
即使有了操作符的优先级和结合性,我们写出的表达式依然有可能不能通过操作符的属性确定唯一的计算路径,那这个表达式就是存在潜在风险的,建议不要写出特别复杂的表达式

感谢您的观看,本文MarkDown文本近1.2w,HTML文本近1w
如果喜欢的话不妨顺手点个赞,收藏,评论,关注!
我会持续更新更多优质文章!!

;