什么是进程
Linux中的进程是指正在运行的程序实例。每个进程都是操作系统内部管理的独立实体,具有自己的地址空间、代码、数据和打开的文件等资源。进程是并发执行的基本单位,可以同时运行多个进程。
Linux中的进程通过创建父子关系形成一个进程树。当一个进程创建子进程时,父进程可以通过进程标识符(PID)来唯一标识子进程。进程可以通过系统调用获取其父进程的PID以及子进程的PID。
每个进程都有自己的状态,包括运行状态、就绪状态和阻塞状态。运行状态表示进程当前正在执行,就绪状态表示进程已经准备好执行,但还未获得CPU资源,阻塞状态表示进程因为某种原因无法继续执行,例如等待I/O操作完成。
进程之间可以通过进程间通信(IPC)机制进行相互通信和数据交换。常见的IPC机制包括管道、信号、共享内存和消息队列等。
进程的生命周期包括创建、运行、挂起、终止等阶段。进程的创建是通过fork()系统调用创建子进程,子进程获得与父进程相同的代码和数据空间。进程可以被挂起或终止,挂起时进程的状态被保存,可以在之后恢复执行。
进程的管理和调度是操作系统的重要功能之一,操作系统通过调度算法为每个进程分配CPU时间片,以实现多任务并发执行。
简单来说,进程就是把程序加载到内存中
有一个简单的公式:
进程=进程对应的PCB结构体+对应的代码跟数据
PCB结构体,process control block(进程控制块),计算机如何描述、管理进程,首先先用结构体把关键信息标识出,再用对应的数据结构进行组织管理!PCB包含了进程的所有属性,同时也是一种笼统叫法,在linux中更具体地名字是task_struct(这是一个C语言写的结构体)
task_struct
task_struct
是 Linux 内核中用于表示一个进程的结构体类型。它包含了一个进程的所有信息,包括进程的状态、调度参数、内存管理信息、文件描述符、进程的父子关系等。
task_struct
结构体在内核中定义为一个非常庞大的数据结构,其中包含了大量的字段。一些常见的字段包括:
pid
:进程的唯一标识符,即进程 ID。state
:进程的状态,如运行、就绪、睡眠等。mm
:进程的内存管理结构体,包含了进程的地址空间信息。files
:进程的文件描述符表,存储了进程打开的文件信息。parent
:指向父进程的指针。children
:指向子进程链表的指针。sched
:调度信息,包括进程的调度策略、优先级等。
除了这些常见的字段,task_struct
还有许多其他的字段,用于存储与进程相关的各种信息。
在 Linux 内核中,可以通过访问进程的 task_struct
结构体来获取和修改进程的状态和属性。例如,可以使用 current
宏来获取当前进程的 task_struct
结构体,然后可以通过访问结构体中的字段来获取进程的各种信息。
linux可以通过ps查看进程,ps axj查看所有进程
fork
头文件#unistd.h
pid_t fork()函数,需要引用头文件unistd.h
首先记住,该函数给子进程反回0,给父进程反回子进程的pid。
fork之后会产生一个子进程,原本的进程也就变成了父进程,fork之后代码是父子共享的,并且也是同时进行的,所以一般会用if else来控制父进程执行什么,子进程执行什么。这也是fork的目的
fork还是非常有用的,后续会有程序替换,当你在xshell敲下各种命令的时候,本质就是shell不断fork子进程来执行你的命令。
进程状态
在 Linux 操作系统中,进程状态用于描述进程当前的执行状态。常见的进程状态有以下几种:
- 运行(Running):表示进程正在执行中。
- 就绪(Ready):表示进程已经准备好执行,但是还在等待 CPU 的分配。
- 睡眠(Sleeping):表示进程因为某种原因暂时停止执行,例如等待某个事件的发生或者等待某个资源的释放。
- 停止(Stopped):表示进程被暂停执行,可以通过调试工具或者系统信号来实现。
- 僵尸(Zombie):表示一个已经结束执行的进程,但是其父进程还没有回收其资源。
- 僵尸新生(Zombie Newborn):这是一个特殊的僵尸状态,表示一个刚结束执行的进程,但是其父进程尚未处理。
这些状态在进程的生命周期中不断变化。进程从就绪状态转换为运行状态,然后根据条件转换为睡眠状态或停止状态。当进程的执行结束时,会变成僵尸状态,在父进程回收其资源后才会彻底消失。
在 Linux 中,可以使用工具如 ps
、top
、htop
来查看系统中的进程状态。此外,开发者也可以使用系统调用如 fork
、exec
、wait
、exit
等来创建、控制和管理进程状态。
孤儿进程&&僵尸进程
孤儿进程:简单来说就是子进程还在运行,但是父进程已经退出了。还有一个特殊的名字,守护进程、精灵进程,这两个名字说的是一个意思,就是一个特殊的孤儿进程。孤儿进程在父进程结束后会被init 1号进程托管,往往不会造成资源浪费(内存泄漏)
简单模拟一个孤儿进程
#include<stdio.h>
#include<unistd.h>
int main()
{
pid_t ret = fork();
if (ret == 0)
{//child process
while (1)
{
printf("hello world\n");
sleep(1);
}
}
else //preant
{
printf("I am father\n");
}
return 0;
}
僵尸进程:简单来说就是子进程退出了,但是因为某种原因父进程迟迟没有得到退出码,不能很好的释放子进程的资源,这样会造成资源泄漏(内存泄漏),所以为了避免产生僵尸进程一般会用wait、waitpid等待子进程结束。
进程优先级
在 Linux 中,每个进程都有一个优先级,用于确定进程在竞争 CPU 资源时的调度顺序。进程的优先级范围通常是从 -20 到 +19,其中较高的负数表示更高的优先级,而较高的正数表示较低的优先级。
Linux 中有两种调度策略:时间片轮转调度和实时调度。在时间片轮转调度中,所有进程具有相同的优先级,并且每个进程在调度队列中依次执行一个固定的时间片。而在实时调度中,进程根据优先级来决定执行顺序,具有更高优先级的进程会被优先执行。
进程的优先级可以通过 nice
命令来改变。nice
命令允许用户调整进程的优先级,较低的数值表示较高的优先级。例如,nice -n 10 command
将 command
进程的优先级设置为较低。
除了使用 nice
命令,还可以使用 setpriority
系统调用来动态设置进程的优先级。该系统调用需要调用者具有适当的权限。
需要注意的是,改变进程的优先级可能会影响系统的整体性能和响应能力。因此,修改进程优先级时需要谨慎考虑,并确保不会对其他关键进程造成负面影响。
调优先级的方法很多,但是不建议进程相关的优先级,这是一个比较鸡肋的东西。现实状况是优先级只有操作系统最清楚,这不太需要自己更改。
进程的4个特性:
1、竞争性 : 系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争属性的。为了高效完成任务,更合理竞争相关资源,便具有了优先级
2、独立性 : 多进程运行,需要独享各种资源,多进程运行期间互不干扰
3、并行 : 多个进程在多个CPU下分别,同时进行运行,这称之为并行
4、并发 : 多个进程在一个CPU下采用进程切换的方式,在一段时间之内,让多个进程都得以推进,称之为并发
环境变量
在 Linux 系统中,环境变量是一组全局可用的变量,用于存储系统配置和用户定义的信息。它们可以影响系统的行为和程序的执行。
以下是一些常见的 Linux 环境变量:
PATH
:指定系统在哪些目录中查找可执行文件。当你在终端中输入一个命令时,系统会根据PATH
变量中的路径查找该命令的可执行文件。HOME
:指定当前用户的主目录路径。USER
:当前用户的用户名。SHELL
:指定当前用户所使用的默认 shell 程序。LANG
:指定当前系统的默认语言。LD_LIBRARY_PATH
:指定可执行文件在运行时查找共享库的路径。TMP
或TMPDIR
:指定临时文件的存储路径。PS1
:定义命令提示符的格式。
你可以使用 echo $变量名
命令来查看特定环境变量的值,例如 echo $HOME
。
要设置环境变量,可以使用 export 变量名=值
命令,例如
export PATH=/usr/local/bin:$PATH
。如果要永久设置环境变量,可以将其添加到 ~/.bashrc
或 ~/.bash_profile
文件中。
除了系统默认的环境变量,你还可以在程序中定义自己的环境变量,并在程序中使用它们。在 C 语言中,你可以使用 getenv()
函数获取环境变量的值,使用 setenv()
函数设置环境变量的值。
总而言之,环境变量在 Linux 系统中非常重要,能够帮助配置和个性化系统行为,以及影响程序的执行。
和环境变量相关的命令:
1. echo: 显示某个环境变量值
2. export: 设置一个新的环境变量
3. env: 显示所有环境变量 4. unset: 清除环境变量
5. set: 显示本地定义的shell变量和环境变量