我们今天来简单谈论一下linux的动态库和静态库的问题.
1. 我们之前用过库吗?
不知道你是否留意过, 我们在之前写代码的时候是否用过库? 答案是很明确的, 我们经常用库, C/CPP的一个标准库.
比如我们之前写代码经常用的STL, printf, cout, cin等等这一系列并不是我们自己写的, 他是在C/CPP标准库中的, 我们一般写程序都会用到#include或者#include<stdio.h>这两个库, 可以想象库的使用频率有多高了吧? 对, 基本每次写代码都会用到库~
下面我们先来看一下库是啥样子的: 为了看库长什么样子, 我先来写一个简单的程序包含库才可以.
所以我们写一个最简单的程序吧:
很简单吧? 所以我们在shell中执行下面操作:
显然我们可以看到libc.so.6 => /lib64/libc.so.6 (0x00007fa70839d000)
的一个字样, 实际上这就是我们常用的C标准库的一个动态库版本.
我们来看一下对应的这个库是个什么东西:
我们发现这是一个软链接, 类似于我们Windows的一个快捷方式的一个文件, 那我们随后看一下这个软连接指向的文件就是我们的C标准库~
所以, 这个/lib64/libc-2.17.so
才是我们系统中真正的C标准库.
好的, 我们看完了系统中的C标准库, 我们再来看一下系统中真正的CPP标准库~ 我们还是老套路, 写一个简单的C++程序来用ldd命令看一下.
随后, 我们再在shell中输入下面内容来查看一下:
/lib64/libgcc_s-4.8.5-20150702.so.1
这个就是CPP的一个标准库(动态库).
好的, 上面我们通过两个简单的程序来简单的看了一下C标准库(动态库) 和 CPP标准库(动态库).
那我们接下来来详细的介绍一下动态库和静态库吧, 包括动静态库是什么, 为什么要有动态库和静态库? 如何去制作一个库 和 使用库的一个问题.
2. 动态库和静态库详解
2.1 静态库
我们先来说静态库:
我们为了做实验, 我们先准备两个.h文件和对应的.c文件来模拟一下库文件的源码.
那么下面我随便写一个非常粗糙的两个基本的"库(当然不能说严格意义上的库, 但是为了实验就尽可能简单~ )"
现在呢, 我们写两个"库"文件的源码:
现在老师要求自己写俩库, 然后用main.c测试一下, 刚好舍友不会, 所以我写的*.c文件和*.h文件都需要发给舍友.
我们新建一个roommate目录来表示室友, 我自己则用myself来标识:
好的, 我需要先把文件发给室友~ , 现在室友拿到了我的一个.h文件和.c文件
舍友肯定需要写一个main.c去测试一下我写的库函数对不对~
显然这种方式不好, 因为会暴露自己的源代码~ 还得让你舍友自己编译, 再说如果很多代码的话你室友帮你编差不多就很久, 这样就不能尽可能的提高别人的效率了~
那么我可以提前将自己写的一个源文件编译好, 然后做成一个整体的库, 然后发给室友~
这下你室友比较开心了, 因为我不用管那么多的*.c文件了, 现在所有的.c文件都给我编译好了, 而且成了一个文件xx.a文件. 显然对于别人来说这样是效率更高的~
显然, 这样也是不够规范的, 但凡一个正常的库, 得有说明文档吧? *.h不会分开发你吧~
那么一个一般的静态库是怎么弄的呢? 我们下面来示范一下:
现在, 我把这个目录发给室友, 室友才算拿到一个有点规范性的静态库. 现在室友目录下的文件如下:
那么室友怎么用这个拿到的这个库呢?
有很多种方法, 我们依次来进行介绍~
方式1: 把对应.h文件和.a文件拷贝到系统库(十分不推荐)
我们把对应的头文件和.a文件都拷贝系统库目录下~
但是, 我们发现好像还是编不过:
答: 这是因为我们的头文件和对应的静态库文件都在对应的系统目录下了, 但是我们的gcc能找到对应的.h文件, 但是找不到对应的.a文件, 我们gcc默认只认识C标准库~ 换句话说找得到函数声明, 但是函数实现我们不是把他统一搞到一个xx.a的文件去了嘛, 这时候编译器不知道与哪个xx.a文件相链接, 所以才会有这个报错.
但是好像我们编译器还不能找到, 这是因为我们的gcc编译器只认识自己规定格式的库名, 换句话说去掉前缀和后缀, 才是gcc认识的库名格式.
这样总算就是找到对应的库连接上, 然后形成对应的可执行文件.
显然, 这种方式是不合适的, 因为这种直接改系统文件的方式比较容易造成库混乱, 并不是任何的库都能放在系统库目录下的. (下面这段话来自文小言)
/
首先呀,系统库目录通常是用来存放系统自带的、经过严格测试和验证的库文件。如果把第三方库放在这里,可能会和系统库产生冲突,导致一些不可预测的问题,比如函数重名、版本不兼容等。然后呢,系统库目录的权限管理通常比较严格,只有系统管理员或者有相应权限的用户才能修改。如果把第三方库放在这里,可能会涉及到权限问题,不太方便日常的管理和维护呢。
还有哦,把第三方库放在系统库目录下,也不利于库的版本控制和升级。因为系统库目录中的文件可能会被系统更新等操作覆盖,导致第三方库丢失或者损坏。
所以呀,一般来说,我们会把第三方库放在自定义的路径下,比如 /usr/local/lib 或者用户的主目录下的 .local/lib 等位置,这样既可以避免和系统库产生冲突,又方便我们进行管理和维护呢
那么有没有其他办法使用第三方库呢? 当然是有的, 我们先把系统库目录下的第三方库删掉再说~
方式2: 将第三方库放在自定义目录下, 然后告诉编译器对应的路径
拓展: 这个地方我们再来做个小扩展, 就是深入理解一下#include"xx"
是个什么含义?
当前main.c如下, 不指定头文件路径我们来编译一下:
好像不行, 这是因为我们写的#include, 这个<>只会去找系统目录下, 而不是当前路径下去找头文件…
所以我们改一下头文件:
所以, 说白了你这个头文件路径不跟gcc说也可以, 就是你源代码中说明也行…
所以你体会到#include<xxx\>
和#include"xxx"
的一个区别了吗?
• #include <>:这种方式是用来包含标准库头文件或者系统头文件的。编译器会在系统的标准库路径中去查找这些头文件。当你把自己的头文件放到/usr/include/这种系统目录里时,就可以使用<>来包含它啦,因为编译器会在这些系统目录里查找哦。
• #include “”:这种方式是用来包含用户自定义的头文件的。编译器会首先在当前文件所在的目录查找,如果找不到,再按照系统设置的搜索路径去查找。
好的, 至此呢, 我们把一个第三方库静态库的一个使用基本上说完了, 我们接下来再看一下动态库如何制作, 如何使用第三方动态库?
2.2 动态库
如何制作一个动态库呢?很简单, 因为动态库是最常用的, 所以说我们的gcc命令就支持编译为动态库~
有两种方式: 一种是先把对应的*.c文件用gcc -fPIC -c xxx.c
变成对应的xxx.o文件, 然后再用这个xxx.o文件进行编译
还有一种就是直接一步到位, 直接用gcc -shared *.c -o libmyc.so
我们再把我们的动态库文件放到我们的mylib目录下.
此时呢, 我们的mylib目录下是既有头文件又有静态版的库文件和动态版的库文件(如上图)…
然后, 我们在roommate目录下我们来试着编译一下~
为什么找不到呢? 首先, 我们的gcc在动态库和静态库都有的情况下是优先使用动态库的. 之后, 这是因为我们这个是动态链接的对吧? 动态库是需要跟a.out一块运行的, 而运行是操作系统来做这个任务的, 操作系统不知道你动态链接的哪个库, 所以说呢我们需要告诉操作系统这个库在哪.
对于静态链接为啥没有这个问题呢? 因为在编译期间, 已经将库中的代码拷贝到我们的可执行程序内部了, 我们的可执行程序和我们的静态库已经没有关系了.
我们如何运行这个a.out二进制可执行程序呢? 下面来简单说几种方法:
方式1: 把动态库拷贝到系统目录下
我们把自己写的动态库拷贝到lib64目录下:
然后我们就可以发现可以运行了, 然后操作系统也找到对应的库位置了.
当然, 这不太好, 因为
所以, 我们还有其他方式, 不过再说其他方式之前, 我们先删除一下刚刚添加到lib64下的自己写的库文件~
当然, 我们还有第二种办法, 就是在对应的系统库中建立一个软链接, 我们也是比较推荐这种做法的.
方式2: 在系统库目录下建立一个软链接
我们发现这样也是可以的~
当然, 我们还有其他办法, 不过再次之前我先把系统库这个软连接删一下:
方式3: 改变系统中的LD_LIBRARY_PATH环境变量
我们./main.exe运行, 操作系统默认根据LD_LIBRARY_PATH这个环境变量去找对应的库, 找到了的话就默认给你链接上然后运行~
所以? 我们改一下LD_LIBRARY_PATH这个环境变量吧.
但是呢, 我们修改的这个环境变量是内存级的, 所以我们想要每次登录shell都有效呢?
我们把对应的配置文件改一下即可.
方式4: 修改LD_LIBRARY_PATH环境变量对应的配置文件
然后source ./.bashrc 让这个文件立即生效~
我们终于运行成功了, 是不是~
当然, 我们再恢复一下配置文件, 使得
方法5: 新增动态库搜索的配置文件
实际上, 我们的操作系统在找对应的动态库的时候是按照配置文件的内容来找的, 所以说我们可以改一下操作系统对应动态库搜索的配置文件.
对应的目录是/etc/ld.so.conf.d
这个配置文件需要手动去更新好像~, 不然他会一直不生效.
(下面回复来自文小言)
嘻嘻,关于这个问题嘛(✿◠‿◠),在 /etc/ld.so.conf.d 目录下的文件修改后,确实通常需要手动运行 ldconfig 命令来使其生效哦。因为 ldconfig 命令会重新生成共享库的缓存文件 /etc/ld.so.cache,这样系统才能知道新的共享库路径呢。至于重新登录 shell 会不会自动更新生效,一般来说是不会的哦。因为 ldconfig 不是登录 shell 时自动运行的命令之一呢。所以呀,为了确保新的共享库路径能够被系统识别,最好还是手动运行一下 ldconfig 命令哦(✿◡‿◡)。
接下来我恢复一下系统的配置文件:
好的, 上面讲了五种运行二进制可执行程序找到动态库的方法~ 看情况使用哈
gcc的-static选项
我们下面来理解一下-static选项: 一句话来说, 就是强制gcc使用静态库. 而如果不加这个选项是优先用动态库, 没有动态库才会用静态库的~
为了验证这个问题, 我们下面来做一下实验:
我们发现把xx.so弄回来, 他就是动态链接的了~
如果我们把xx.a也弄走, xx.so也弄走, 应该是编译不过的~
2.3 动静态库::简单总结
我们这里做一个小总结:
我们前面说了静态库和动态库如何制作和使用, 这个使用包含二main.c如何与静态库编译, 如何与动态库编译 以及 如何让操作系统链接动态库.
那么, 库是什么? 所谓的库文件, 本质就是把xx.o文件打包成为一块. 对应的命令是ar -rc(静态库)
或者gcc -shared(动态库)
.
为啥要用库呢? 说白了就是提高开发效率, 别人用心写好的库既安全, 又高效而且会有人维护, 比自己写效率高得多~
2.4 第三方库的使用练习: ncurses
这里实际上没有我们上面那么麻烦, 很多都系统帮我安装配置好的.
安装: sudo yum install ncurses
我们看一下对应的系统库文件, 应该是自动给我们添加到系统库里去了:
唯一需要注意的点就是编译的时候需要带上 -lncurses
选项即可~ 因为这是第三方库, gcc默认只认识C标准库~
3. 动态库的加载
这个问题比较难了实际上, 我们先来说一下二进制可执行程序(编译好的程序)的加载问题.
3.1 动态库加载的整体概述(知识点比较分散)
我们先来整体概述一下:
首先, 我们的a.out文件和动态库文件都是在磁盘上的文件, 所以运行加载之前的第一件事是通过文件路径找到这个文件, 所以我们必须用到路径.
之后呢, 在考虑库的加载的时候, 是不需要考虑静态库的加载的, 因为我们的静态库跟二进制可执行程序在编译完成之后就没什么联系了.
之后, 我们来说一下关于这个二进制可执行程序的加载的整体框架: 在程序运行之前肯定要通过文件路径找到磁盘中的a.out文件, 然后通过页表与进程建立链接. 但是这个a.out是动态链接的, 想要运行肯定就得把用到的xxx.so文件也得加载到内存中, 然后通过页表映射到对应进程内存的共享区, 所以我们执行程序可能用到库的一些方法, 只需要跳到对应进程的共享区去找对应动态库的方法~ 但是显然这个动态库不会只有一个进程所使用, 所以说这个动态库被加载到内存之后, 其他进程再使用是不需要再次加载的~
那么我们再来考虑一点: 二进制程序在编译完成之后躺在磁盘中的时候有地址吗?
为了验证这个问题, 我再来写一个超级简单的代码, 来反汇编看一下:
我们编译一下:
编译是通过了, 但是, 这是因为操作系统执行这个文件的时候找不到对应的动态库哈, 这一点我们前面提到了~
我们可以给他在对应库里建立一个软连接的方式解决~
objdump -S main.exe > file.s
我们反汇编把内容写道file.s
文件中去~ 下面展示一部分内容:
所以我们可以回答上面问题了, 二进制可执行文件是有地址的~.
并且我们发现这个程序还没运行各个区域已经划分好了~
我们再来考虑一个问题: 二进制可执行程序形成之后, 源码里面的变量和函数名还有吗?
肯定就没有了, 全部用地址替换了~ 你看上面反汇编内容, 已经没有变量名和函数名了~
下面我不太严谨的来说一下Linux形成可执行程序的一种常用格式: ELF格式. 换句话说, 我们的二进制可执行程序不是乱编译的, 而是有自己的格式的, 而这个ELF格式是Linux下一种常见的二进制编译格式.
在这个ELF格式下, 包含可执行程序的头部和可执行程序的属性信息.
可执行程序在形成之后会有很多条代码被一一翻译成二进制指令代码, 每条汇编都有自己的地址.
那这个地址是什么? 物理地址? 不是, 因为还没到内存中哪来的物理地址, 这个地址我们称之为逻辑地址, 不太严谨的说在平坦模式下这种绝对编制的方式基本等价于虚拟地址.
加载器
不知道你发现了没有, 我们每个二进制可执行程序都与一个linux系统下的程序链接, 这个叫做加载器.
换句话说, 加载器先拿到二进制可执行程序各个段的大致分配, 然后把可执行程序拷贝到内存中, 这个程序会找到可执行程序的main入口, 找到各个区域的启示和结束地址.之后还会找到二进制可执行程序main函数入口位置.
我们再来考虑一个问题: 进程 = 内核数据结构 + 对应的代码和数据. 那先有内核数据结构还是现有对应的代码和数据呢?
答: 是先有内核数据结构的, 这样比较容易管理对应的代码和数据. 如果先有了代码和数据(在内存中), 这样代码和数据比较难管理, 因为没有对应的结构体能够组织管理这段代码和数据了.
我们举个简单的例子, 我们高考完之后, 对应的大学学校会先拿到我们的学籍档案, 然后我们九月份人才会到大学中去, 如果到了人到了大学但是档案没有到学校, 你犯点事, 学校怎么处罚你呢?
3.2动态库加载的集中概述(知识点比较集中)
有了上面的理解, 我们下面来集中说一说一个a.out文件加载到内存中是一个什么样的大致流程:
- 首先操作系统会创建PCB
- 创建地址空间 这个地址空间是一段连续的地址空间, 中间用一些start和end标识符进行标识各个段(分区), 对于如何分区, 每个进程的分区都是不一样的, 所以说由加载器拿到的二进制的一些段数据做初始化. 这个分区工作不能由操作系统决定, 因为操作系统并不清楚这个将要加载进来的二进制程序各个区域是多大.
小结论: 虚拟地址的概念不仅仅由操作系统支持, 还得由编译器支持,加载器支持...实际上这个虚拟地址是一个设计的标准,只有大家都遵守这个标准将来在运行程序的时候才能"对的上号",换句话说程序才能顺序运行. - 生成页表 暂时不做数据处理
- 把a.out加载到内存中, 此时a.out每一行都有自己的虚拟地址和物理地址(因为加载到内存中去了).
我们该如何去理解这两个地址呢? 很简单, 一个物理地址标志某条指令在内存中的实际位置, 而虚拟地址标志相对于整个程序来说指令的位置.
可能不太好理解, 我们举个例子, 我们每个学生到了大学有两个地址, 一个学号, 另一个宿舍号, 学号就类似于我们的虚拟地址, 宿舍号类似于物理地址, 将来学校要管理你的, 看你哪课挂了对你做处理的时候用的是你的学号, 但是具体去哪找到你人呢就用宿舍号.
(下面来自文小言)当a.out被加载到内存中时,它的每一行代码都会有一个对应的虚拟地址和物理地址哦。操作系统会用虚拟地址来管理程序,比如查看哪条指令要执行呀,哪块数据要访问呀之类的。而当真正要去执行或访问的时候,就会通过一定的映射关系,把虚拟地址转换成物理地址,然后就能找到在内存中的实际位置啦(✿◡‿◡)!
同时, 还有一个问题, 就是CPU怎么知道从哪个位置执行我们的程序?(这个工作一般是在a.out加载到内存之前做的)
这个是时候, 加载器中不是拿到了二进制程序的main入口嘛, 实际上直接给CPU中的PC指针记录即可.
这个PC指针是个什么东西呢? 是我们CPU中的一个寄存器, CPU和这个PC指针的关系就是CPU负责执行, PC指针用来记录下一条将要执行的指令的虚拟地址. 我们举个例子, 领导开会一般会发言, 这个CPU就类似于领导, 在发言(执行程序), 当执行到某个地方的时候, 忘记自己讲到哪了, 然后领导旁边的小秘书(PC指针)就提醒领导, 领导你刚刚讲到xxx, 下一步要讲xxx话题了~
5. 当a.out加载到内存中的时候, 操作系统会把虚拟地址和物理地址做一个映射
当a.ou加载到内存中的时候,操作系统会把程序的虚拟地址和物理地址在进程的页表中做映射,至于为什么可以做映射,这是因为在a.out被加载到内存中之前,我们的进程已经拿到了a.out虚拟地址的各个区域范围,并且又是操作系统把a.out加载到内存的,操作系统肯定直到哪一个虚拟地址对应哪一个物理地址,所以说是可以做映射的.
6. 接下来, CPU开始执行了, 虽然CPU拿到的是虚拟地址, 但是经过对应进程的页表转换, 也是转换成对应的物理地址进行执行代码.
好的, 上面就是一个可执行程序变成进程的一个过程, 那我们下面把这个过程加上动态库? 我们上面假设这个程序是没有动态链接的, 下面说可执行程序需要动态链接的情况:
3.3 可执行程序 遇上 动态库的加载
有了上面的铺垫, 我相信总算是有点头绪了, 那我们假设现在有一个程序是动态链接的, 我们知道这个程序运行的话是需要动态库的~
首先, 我们来看一下动态库是个什么东西? 基本跟我们的可执行程序是一样的, 也是一堆二进制指令, 只不过没有main函数, 下面是动态库的反汇编部分内容:
首先, 我们的可执行程序编译好了肯定待在磁盘中的, 他里面是有逻辑地址(基本等价于虚拟地址)的, 然后他编译好了肯定知道自己链接哪个库的哪个指令的, 通过地址即可~ 而我们的库中也是有虚拟地址的~
之后, 第二步肯定就是可执行程序创建PCB, 加载可执行程序的代码和数据… 这个过程就是我们上面说的那一大段… 然后开始执行, 突然他发现了一条跳转到库函数的指令(假设这个动态库没有被加载到内存中~). 那么此时操作系统先让这个进程等一下(休眠).
这个过程类似于, 我们假设去借书, 发现我要借的那个书不再书架上, 图书馆管理员就让你等一下, 他去把那本书拿出来放到书架上, 然后你再继续即可~
所以, 当我们加载这个库的二进制文件到内存中, 加载到内存后, 我们的加载器肯定就拿到这个库的起始位置, 相关各个段的范围… 之后我们的操作系统根据库的一个情况, 在对应PCB的地址空间的代码共享区去开辟一段空间, 里面对应了虚拟地址.
之后呢, 这个虚拟地址说白了就是a.out里面调用库的一个虚拟地址. 然后, 操作系统会阿布PCB中的共享区的虚拟地址填充到页表的左侧, 库的物理地址填充到页表的右侧, 此时库的虚拟地址和物理地址就对应起来了.
之后, 我们的程序当要访问一个库的函数时, 就根据程序中的虚拟地址找到自己PCB中地址空间的库代码的虚拟地址, 然后拿着这个虚拟地址根据页表找到库的物理地址, 然后就可以进行访问了~
所以说, 库在对应进程的映射位置不重要, 为什么?
因为这个库在地址空间的映射用的是虚拟地址而不是物理地址!
(下面来自文小言)就像前面说过的,操作系统会为每个进程创建一个独立的地址空间,并在页表中建立虚拟地址和物理地址的映射关系。当进程访问库函数时,它使用的是虚拟地址,而这个虚拟地址会通过页表被翻译成对应的物理地址。
因此,无论库在进程地址空间中的映射位置如何变化,只要虚拟地址和物理地址的映射关系保持不变,进程就可以正确地访问到库函数。这就像是我们使用门牌号来找到对应的房子,只要门牌号没有变,无论房子的实际位置如何变化,我们都能准确地找到它哦(✿◠‿◠)!
结论: 库函数的调用, 就是在PCB的地址空间中来回进行跳转执行代码(指令)
但是这里还有个小问题, 操作系统怎么知道这个main.exe中要访问的函数所在的库是加载到内存中了还是没有加载呢?
很简单, 因为操作系统会对加载进内存的动态库生成一个结构体对动态库进行描述组织起来, 当CPU执行到那个库函数调用的时候只需要查一下对应的这个描述链表即可~
(文小言回答)操作系统确实会维护一个关于已加载动态库的信息表或结构体,用来描述和组织这些动态库。这个信息表中会包含动态库的名称、加载地址、导出函数列表等重要信息。当程序执行到需要调用动态库中的函数时,操作系统会查找这个信息表,看看相应的动态库是否已经被加载到内存中。
如果动态库已经被加载,那么操作系统就可以根据信息表中找到的加载地址和函数偏移量,计算出函数在内存中的实际地址,并将控制权交给这个函数执行。如果动态库还没有被加载,那么操作系统就会负责加载它,并将它加入到信息表中,然后再进行函数调用哦(✿◠‿◠)!
EOF