Bootstrap

《JavaEE》----1.<计算机是怎样工作的>

前言:

      大家好,我目前在学习java。我准备利用这个暑假,来复习之前学过的内容,并整理好之前写过的博客进行发布。如果博客中有错误或者没有读懂的地方。热烈欢迎大家在评论区进行讨论!!!

      喜欢我文章的兄弟姐妹们可以点赞,收藏和评论。如果感觉有所收获可以关注我呦。我会持续更新滴,望支持!!!!!!一起加油呀!!!!

语言只是工具,决定你好不好找工作的是你的能力!!!!!

学历本科及以上就够用了!!!!!!!!!!


本篇博客会简单介绍计算机是如何工作的、计算机的发展史、cpu的工作原理、组成、操作系统、存储器、输入设备、输出设备,

计算机的发展史

计算在过去也是普遍存在的,让我们看看计算工具是如何一步步发展知道今天的计算机的。

下面是计算工具的大致发展过程图。

冯诺依曼体系

现代的计算机, 大多遵守 冯诺依曼体系结构 

 

中央处理器CPU:进行算数运算和逻辑判断。

存储器:分为内存和外存,用于存储数据(采用2进制存储)

输入设备:用户给计算机发送指令的设备。

输出设备:计算机给用户汇报结果的设备。 

一、一台计算机的组成

硬件部分:

1. 中央处理器(CPU):计算机的核心部件,负责执行指令、处理数据和控制各种硬件设备。

2. 内存:临时存储数据和指令,用于CPU执行过程中的读写操作。内存主要包括随机存取存储器(RAM)和只读存储器(ROM)。

3. 输入设备:将外部数据转换为计算机能够识别的形式,并输入到计算机系统中。常见的输入设备包括键盘、鼠标、扫描仪等。

4. 输出设备:将计算机处理后的数据以适合人类阅读或其他设备使用的形式输出。常见的输出设备包括显示器、打印机、音响等。

5. 存储设备:用于永久性地存储数据和程序。常见的存储设备包括硬盘、固态硬盘(SSD)、光盘、U盘等。

6. 通信设备:负责计算机系统与其他设备或网络之间的数据传输。常见的通信设备包括网卡、路由器、调制解调器等。

软件部分:

1. 操作系统:计算机系统的基础软件,负责管理硬件资源、提供用户接口和运行应用程序等功能。常见的操作系统包括Windows、macOS、Linux等。

2. 应用程序:针对特定任务或需求开发的软件,如文本编辑器、图像处理软件、游戏等。

3. 系统软件:为计算机系统提供基本功能和服务的软件,如驱动程序、编译器、数据库管理系统等。

4. 工具软件:用于辅助用户完成特定任务的软件,如杀毒软件、压缩软件、文件管理器等。

5. 编程语言与开发环境:用于编写和调试计算机程序的软件和工具,如C++、Java、Python等编程语言和相关的集成开发环境(IDE)。

1.1 CPU

又叫中央处理单元,它是人类当今科技领域中的巅峰之作之一。能早CPU的国家没几个,虽然技术门槛非常高,但是却很便宜。(cpu通过大规模量产,降低成本,且升级换代非常快,每一代提升都很大,这使得旧版本cpu价格又会大幅度降低。)

主要厂商:intel和amd,高通(做手机的cpu)苹果(M2芯片和intel amd之类的没法相提并论..价格高,性能一般)。

Intel CPU首先是产品线

给服务器用:叫志强

给家用:叫酷睿

给嵌入式低功耗设备:叫赛扬

其中酷睿首先分代数,其次

i3:入门级

i5:普通级

i7:高端级

i9:旗舰级 

一般来说13代i5>12代i7

为什么分i3和i5,i7,i9呢?

cpu加工时有一个”良品率“cpu内部有非常精密的结构,存在大量的计算单元,每一个计算单元的体积都极小,给加工制造带来非常大的难度~~光刻机是制作cpu中非常重要的一个环节,制造这一个cpu,上面的计算单元不可能全是好的,通过软件/硬件把坏的计算单元屏蔽掉。好的便是i9,其次便有了i7,i5,i3。

摩尔定律

cpu这类芯片,每隔18个月,集成程度就能提高一倍,计算效率就接近提高一倍,同时成本下降一半。指数级增长。

归纳起来,“摩尔定律”主要有以下3种“版本”:
1、集成电路芯片上所集成的电路的数目,每隔18个月就翻一番;
2、微处理器的性能每隔18个月提高一倍,而价格下降一半;
3、用一美元所能买到的计算机性能,每隔18个月翻两番

cpu发展这么多年,50年+,摩尔定律始终生效。

ps:不要买品牌整机,很坑,贵,东西还不好。不如自己组装,或者买组装好的整机。

现在计算机硬件发展极快。 

ps:垃圾佬:他们通过低价买一些性能还能打的硬件设备,组装出性能还不差的主机~~

如何衡量CPU性能?

重点

①主频:假如2.50GHz,可以简单理解成一秒钟cpu可以执行25亿条指令。现在的cpu主频都是在时刻改变的,根据当前任务的负载程度,动态变化~~,任务管理器可以看到实时频率叫睿频。cpu越好,cpu睿频上限越高。甚至有的cpu还可以超频。给cpu吃更多的电,cpu就有更强的表现。

PS:笔记本cpu中U这个后缀,表示低压CPU。

②核心数:最开始cpu都是单个核心,(核心可以理解成一个能完整计算功能的整体,是由很多的计算单元构成的,提高集成程度,提升cpu的速度。但随着时代的发展,随着集成程度提高,发现进一步提高越来越难)减小单个计算单元的体积,势必就会增大工艺的难度~~当体积小到一定程度,经典力学就失效了。量子力学接管战场...因此基础物理限制了我们的工艺水平。一个核心不够,那就多个核心来凑,1核=>2核=>4核=>8核...又给摩尔定律续命一波。

在任务管理器中我们可以看到

内核(物理核心):是cpu焊上去的核心

逻辑处理器(逻辑核心):现代cpu有一个超线程技术,可以让核心一个顶俩

13代intel cpu有大小核技术,大核一个顶俩,小核一个顶一个,如果要做复杂任务就会用大核(耗电多,发热高),简单任务用小核(耗电少,发热低)尤其是笔记本。

学校学的课程对应的cpu

高数,大学物理,模电,数电,机组,计算机系统结构,微机原理和接口技术都是在讨论cpu)是一个上古时期的cpu,不是现在的cpu。8086 是intel之前一个比较知名的产品,70年代的cpu。差异还是非常大,涉及到汇编语言(CPU指令)要想运行就得用模拟器之类的东西。当然可以先学好之前简单的cpu,便于理解现代更复杂的CPU。

CPU 基本工作流程

首先介绍cpu工作流程所要用到的部件

①逻辑门

电子开关

通过电子开关,我们可以实现 1 位(bit) 的逻辑运算 

门电路:包括与门、非门、或门、异或门等等。

②算术逻辑单元 ALU:

ALU 是计算机中进行算数、逻辑运算的核心部件,是计算机的数学大脑。

我们可以通过连接电子开关、门电路、算术逻辑单元ALU

算数单元,负责计算机里的所有数字操作,比如四则运算,当然它能做的远远不止这些。

比如8 位(bits)的加法器

 

 

逻辑单元(Logic Unit) 

逻辑单元主要用来进行逻辑操作,最基本的操作就是 与、或、非操作,但不只是一位(bit)数的比较。

③寄存器(Register) 和内存(RAM)

光有 ALU 还是远远不够的,我们无法为 ALU 提供存储的部件。利用门电路可以制作存储器。不过这些存储都是要求必须保持通电状态的,也就是这些存储都是易失的(volatile)。

下面简单说一下简单说明 下存储的制作。

中间我们隐藏了一些实现细节,最后的效果就是:使能线置位时,输入为 1,保存 1;输入为 0,保存 0。使能线不置位时,则写入无效。 我们可以利用门锁,构建我们需要的寄存器和内存。

内存的构建要比这个复杂一点,但基本原理一致。如此构建的内存被称为 RAM(Random Access Memory),可以支持 O(1) 时间复杂度访问任意位置的数据,这也就是我们数组下标访问操作是 O(1) 的硬件支持。

上面的说明都隐藏了大量的实现细节 。感兴趣的朋友可以进行深入了解。

④控制单元 CU(Control Unit) 

我们现在有 ALU、存储了,但这还是不足以让我们的计算机工作起来,我们需要有一个部件来指挥 ALU 进行何种的运算,而这个部件就是控制单元(CU)。

CU 如何由门电路从无到有搭建,我们就进行抽象了,我们只需要理解 CU 可以驱动 ALU 进行具体 的计算工作

指令(Instruction)

我们知道CU 可以驱动 ALU 进行具体 的计算工作。

我们先介绍下我们需要到的指令(instruction)。 指令是cpu上能够执行的任务的最小单元

所谓指令,即指导 CPU 进行工作的命令,主要有操作码 + 被操作数组成。

其中操作码用来表示要做什么动作,被操作数是本条指令要操作的数据,可能是内存地址,也可能是寄存器编号等。

指令本身也是一个数字,用二进制形式保存在内存的某个区域中。

比如:加法指令,读取内存指令,写入内存指令,条件判定/跳转指令,函数调用指令,堆栈操作指令......

最小单元由二进制的方式来表示叫做机器语言

不同架构的cpu支持的指令/机器语言是不相同的。

CPU 的基本工作流程

 演示指令运行的一个周期。

 

 

 

 

总结指令的运行周期。 

 

当然,电子计算机中的 CPU 可不像我们刚才那样,靠自己来驱动这个周期的运转,而是靠背后一个时钟 来进行周期驱动的。

知乎问答:时钟频率是什么 
主频:

粗略的讲,cpu主频就是时钟震荡的每秒次数。可以近似看作每秒执行的次数

最后,ALU + CU + 寄存器 + 时钟就组成了我们平时经常看到的一个词汇:

中央处理器(Center Process Unit)简称 CPU。 

CPU总结

1. CPU 中的 PC 寄存器,是决定 CPU 要执行哪条指令的关键;

2. 指令是由 动作 + 操作对象组成

3. CPU 眼中只有指令,没有其他的概念

1.2 操作系统(围绕Linux进行讨论)

Windows10

Windows11

linux

mac os

android

ios

这些操作系统,本质上都是用来搞管理的软件

1.2.1操作系统的功能

注意:有的数据库/虚拟机软件支持在裸机上跑...程序内置了一个操作系统,这种另当别论。

1.对下管理所有的硬件设备

操作系统知道市面上硬件设备就那么几个大类,每个大类别下面的硬件设备大概都有哪些功能~硬件厂商需要在开发硬件的时候同时开发一个驱动程序(软件)专属于这个硬件设备,让操作系统通过这个驱动程序完成对这个硬件设备的控制

2.对上要给软件提供稳定的运行环境        

进程的隔离性:一个计算机可以同时运行多个程序,这些程序各自独立运行,不会互相干扰,防止如果每个程序出现bug,就直接导致系统重启,其他程序崩溃。

操作系统给应用程序提供一些API ,让应用程序去调用, 实现操作系统一些功能,比如 就可以控制一些硬件设备

1.2.2操作系统内核

是操作系统最核心的功能模块。硬件的驱动程序,都是在系统内核中执行的。内核需要给很多应用程序提供支持,提供API进行调用。此处这些系统api都被JVM封装好了,因此java程序员一般不会直接接触到系统的api~。

java具有跨平台性,不同的系统提供的api是不同的,JVM对这些系统api就封装了(类似于JABC)

内核态

用户态

一个程序在运行过程中,可能是在用户态工作,也可能是在内核态工作。

一个操作系统=内核+配套的应用程序

进程/任务pocess/task

操作系统内核中涉及很多关键性概念,进程只是其中一个,此处重点就只讨论进程

指正在运行,已经跑起来的程序。windows这个操作系统,一开机就有百八十个进程跑起来,有些是系统自动创建的,有些是手动创建的。每个进程都是系统资源分配的基本单位。

进程在系统中如何进行管理

1.描述 使用类/结构体PCB ,把被管理的一个对象,各个属性表示出来

系统中专门有一个结构体(操作系统内核是使用c/c++写的)描述进程的属性这个结构体统称为“进程控制块”PCB,使用这个PCB描述进程的属性。一个进程就可以使用一个或多个PCB来表示

2.组织 使用双向链表,把这些表示出来的对象串起来(为了后续增删改查)

系统会使用类似于双向链表这样的数据结构来组织多个PCB。创建新的进程就是创建PCB并且把PCB插入到链表中。销毁进程就是把PCB从链表上删除并释放,展示进程链表,相当于遍历链表的每个节点。

如果想更明确认识进程详细特性,还需要讨论一下pcb里面的属性,PCB是一个庞大的结构体,包含很多属性,(操作系统源码里面有,linux这样的系统属于开源的,可以看到源代码)

linux中,pcb叫做task_struct

PCB里面的信息

一.pid进程的身份标识

每个进程都会有一个pid,同一时刻,不同进程之间的pid是不同的

二.内存指针(描述了进程持有的“内存资源”是啥样的~):

每个进程运行的时候,都会分配一定的内存空间,这个进程,内存空间具体是在哪里,以及分配的内存空间中有哪些部分,每个部分都是干啥的...有这么一组指针来进行区分,最典型的,进程的内存空间,需要有专门的区域存储要执行的指令,以及存储指令依赖的数据~~同时还需要存储一些运行时产生的临时数据。

执行的指令:(C语言程序写的一些代码/函数=>exe包含了一些二进制指令,双击exe系统就会读取可执行文件,将内容加载到内存中。(exe中的数据也是要加载到内存中),cpu才能从内存中取走指令,进一步进行执行指令

(cpu一般不会直接读硬盘,都是从内存里面读取数据。先从硬盘把指令加载到内存中,再让cpu从内存中读取指令)

三.文件描述符表(文件描述符表描述了进程持有的“硬盘资源”是啥样的

(类似于顺序表这样的数据结构,有很多元素)

和文件有关=>硬盘 有关,文件它是存储在硬盘上的,计算机操作硬盘,并不是直接操作硬盘这样的硬件设备,而是把硬盘上面的存储空间,以文件的形式来去进行表示,真正代码里面操作的是文件,实际上硬件上操作的就是硬盘

一个进程也需要涉及到硬盘操作(从硬盘读写数据),就需要按照文件的方式来操作,当前进程关联了哪些文件,都能操作哪些文件,就是通过文件描述符表。去进行表示的。文件描述符表将文件组织,后续的指令就可以在这里针对文件进行操作。

进程持有的cpu资源如何体现?

这个关于进程的调度

什么是并发编程?

早期的操作系统

是一个“单任务操作系统”同一时刻只有一个进程能运行,运行下一个进程,就会退出上一个...不需要考虑调度。

一个进程要执行,就是需要cpu来执行这上面的指令~早期的电脑还是单核cpu,一个cpu核心,同一时刻,只能执行一个进程的指令。

分时复用,并发执行(针对单核cpu):使多个进程在不同时间进行,如果进程在cpu上轮转速度足够快。那么看起来就像是一个cpu在同时进行多个进程。实际上同一时刻还是只执行一个进程。

逻辑处理器:16个,相当于有16个核心来处理进程。

实际上现代cpu都是多核心的,如果两个进程同时在两个cpu核心上,微观上也是“同时执行”,这个情况称为“并行”。快速轮转调度的方式,执行多个进程,宏观上是“同时”进行,微观上有先有后,这个情况称为“并发”

并发和并行,在应用程序这一层,感知不到~都是系统内部完成调度的~

普通程序员平时也不会具体区分并发还是并行,从编程角度来说,底层是并发还是并行,对代码没啥影响。  

因此平时会统一使用“并发”来代指 "并发" 和 "并行" 来。

并发编程包含了并发和并行编程。

多核心cpu时代,并发编程是一个很重要的话题,一个系统中有这么多进程,也就是为了实现并发编程的效果。假设只有一个进程,cpu搞16个核心,也没有什么用。多核心对多任务进行,有着很大的帮助。

PCB中引入了一些属性,用来支持操作系统实现进程调度的效果

四.进程的状态

1.“就绪状态” 时刻准备好去cpu上执行。

两种情况

①进程正在cpu上执行

②虽然进程没在cpu上执行,但是时刻准备着去cpu执行

2.“阻塞状态”

某个进程,某种执行条件不具备,就导致这个进程暂时无法参与cpu的调度执行,比如:进程等待用户的输入...

进程的状态还有许多其他种状态,这些状态不做进一步讨论..以上两个是最重要的两个状态。

五.进程的优先级

操作系统在调度多个进程的时候,并非是一视同仁,有些进程会给更高的优先级,优先调度。

六.进程的上下文(进程的结构)

进程从cpu离开之前,需要保存现场,把当前cpu中各种寄存器的状态,都记录到内存中。等到下次进程回到cpu上执行的时候,此时就可以把保存的这些寄存器的值,恢复回去.进程就会沿着上次执行到的位置继续往后执行。

(用于存档,读档)

cpu中有些寄存器,属于没有特定含义,就只是用来保存运算的中间结果。还有些寄存器,是有些特定含义,特定作用。

1.保存当前执行到哪个指令的寄存器 也叫(程序计数器)

是一个2/4/8字节的整数,这个整数存储的是一个内存地址。程序下一条要执行的指令所在的位置。exe里面就包含了指令和数据 把exe运行起来,操作系统就会把指令和数据加载到内存中(内存地址)CPU就会先从 内存 中取指令,然后再执行指令。初始情况下,程序计数器就指向进程指令的入口(可以当做是main方法)

每次取完一条指令,程序计数器的值都会自动更新,默认情况下,直接指向下一条(顺序执行)但是遇到 跳转类指令(jmp,jcmp,call...),就会被设置成跳转的地址......

2.维护栈相关的寄存器

通过这一组(一般是两个)维护当前程序的“调用栈”

栈,也是一块内存,这个内存里就保存当前这个程序方法调用过程中,一系列的关系。(也包含局部变量和方法参数..)

ebp寄存器始终指向栈底

esp寄存器始终指向栈顶,修改esp的值就可以实现“入栈”/“出栈” 会有push等指令完成上述操作

有了这个 我们才知道一个方法执行完毕之后,回到哪里执行。

3.其他的通用寄存器,往往是用来保存计算的中间结果的,比如程序正在计算一个表达式

10+20+30+40 假设算完10+20后,还没来得及计算后面,进程调度走了,就需要把保存10+20的寄存器的值给备份到上下文中。 10+20的计算结果存储在寄存器中。

一个cpu里的寄存器也没多少(不同cpu不一样)

几十个字节到几百个字节...(数据不多,保存也好保存,恢复也好恢复)

将这些寄存器可以很方便的存储在内存中,

存档:把寄存器的值保存在PCB中,PCB都是在内存中。

读档:等到下次执行,可以再把存在PCB的值恢复到寄存器上。

七.进程的记账信息

通过优先级机制,对不同的进程分配了不同权重的资源,有可能会出现极端情况,所有的资源都给某个进程,其他进程一点都没分配到。

为了防止这种情况发生,记账信息会记录当前进程持有cpu的情况(在cpu执行多久了)就可以作为操作系统调度进程的参考依据。

总结(操作系统对进程的管理):

关于进程,我们知道了进程,指的就是一个跑起来的程序,也就是一个正在执行的任务。它可以完成我们指定的一些实际工作,这样的操作会消耗一定的系统资源,操作系统包含的进程不是一个两个,而是非常多的进程。这时候我们想要操作系统对这些进程进行良好的管理,我们采取PCB:task_struct,来去描述一个进程,再通过双向链表来去组织这些进程,按照这样的一个方式,我们就可以把这些进程进行管理了,此时我们如果想创建新的进程,本质上就是创建新的PCB,再加到链表中,我们想去查看进程链表,就是在遍历这个链表,我们想去销毁这个进程,就是把这个进程的PCB在双向链表中进行删除。

虚拟地址空间:

早期的操作系统,程序员运行时分配的内存就是“物理内存”RAM

 这种物理内存相当于宿舍楼,有很多房间,每个房间都有一个编号,这个编号就相当于内存地址。编写代码时,申请可以进行申请内存,写出bug如果内存访问越界了,那么被称为野指针“未定义行为”。若进程A使用了某块物理内存,如果进程B不小心也使用到了进程A的物理内存,将这块物理内存做了修改,那么此时可能会导致进程A崩溃。因此这样设计不合理。

进程的独立性

操作系统引入“虚拟地址空间”概念,不是直接分配物理内存了,而是分配虚拟的内存空间,操作系统对于内存又进行了一层抽象。

此时进程A和进程B存于虚拟内存。虚拟内存和物理内存通过操作系统存在一个映射关系。进程A操作某个内存的数据,就需要把操作的虚拟地址告诉操作系统,操作系统再把虚拟地址翻译成物理地址,再操作物理地址(有一个类似于hash表这样的映射结构,称为 页表)。翻译的过程中操作系统会进行检查和校验。操作系统会看当前这个虚拟地址能否完成翻译。如果给的虚拟地址是非法的,如:越界访问,系统就能及时发现,并且对当前进程进行处理,不会波及到其他进程。(不会真的对物理内存进行修改)。

这个叫做进程的独立性:每一个进程都有自己的一套虚拟内存空间。不会影响到其他进程。

多个进程相互配合:

如果确实需要让多个进程相互配合,此时就不好操作了,我们引入了新的机制来实现进程之间的通信,“借助一个公共空间,完成数据的交互”

进程之间通信方式(有很多种,主要介绍两种)

1.通过文件.(进程A写这个文件,进程B读这个文件)

2.通过网络(socket).借助网卡

后面详细介绍

1.3 存储器

①内存:速度快,空间小,成本高,掉电后数据丢失

②外存:速度慢,空间大,成本低,掉电后数据不丢失

最近两年,有商家研发出了新的存储介质,同时具备内存和外存的特性

1.4  输入设备:

负责将用户的指令和数据传送到计算机系统

1.5 输出设备:

将计算机处理后的数据和信息呈现给用户的硬件设备

总结

计算机就像个超级快速的处理器,通过执行简单的指令(加、减、复制等),来处理和存储数据。它用电信号来表示和操作二进制数(0和1),通过组合这些操作来实现复杂的任务,比如显示网页、播放视频或运行游戏。输入设备(如键盘和鼠标)提供数据,处理器(CPU)执行程序指令,存储设备保存数据,输出设备(如显示器和打印机)展示结果。

;