[linux]--关于进程概念(下)

目录

孤儿进程

环境变量

将程序放到PATH路径下

设置PATH环境变量

设置别名

环境变量相关的命令

 环境变量的组织方式​编辑

通过系统调用获取环境变量

环境变量通常是具有全局属性的

进程优先级

查看系统进程

用top命令更改已存在进程的nice:

程序地址空间


我们上一篇讲了僵尸进程,知道如果子进程退出没有给到父进程返回码,子进程就会被系统维护,一直处于僵尸状态Z,那么,如果是我们的父进程提前退出了而不是休眠,子进程再退出,陷入Z状态,有没有处理方案呢?

孤儿进程

父进程如果提前退出,那么子进程后退出,进入Z之后,那该如何处理呢?

父进程先退出,子进程就称之为“孤儿进程”

孤儿进程被1号init进程领养,当然要有init进程回收喽。

#include <stdio.h>
 #include <unistd.h>
 #include <stdlib.h>
 
int main()
 {
    pid_t id = fork();
    if(id < 0){
        perror("fork");
        return 1;
    }
    else if(id == 0){//child
        printf("I am child, pid : %d\n", getpid());
        sleep(10);
    }else{//parent
        printf("I am parent, pid: %d\n", getpid());
        sleep(3);
        exit(0);
    }
    return 0;
 }

 

这段命令是一个简单的 Bash 脚本,让我来逐步解释一下:

  1. while :; do ... done:这是一个无限循环结构,其中 : 表示一个永远返回 true 的条件,因此这个循环会无限执行。

  2. ps axj | grep mytest | grep -v grep:这部分命令的作用是通过 ps 命令查看当前系统中所有进程的状态,并使用 grep 命令过滤出包含 "mytest" 字符串的进程。第二个 grep -v grep 的作用是去除含有 "grep" 字符串的行,避免误判。

  3. sleep 1:这是让脚本暂停 1 秒,然后再继续执行下一次循环。

  4. echo "##########":输出一行 ##########,用来做分隔符或者标记输出结果。

作用是不断地检查系统中是否存在名为 "mytest" 的进程,每隔 1 秒输出一次检查结果,并用分隔符标记不同的输出

 也就是说,当我们的父进程先退出了,操作系统会把子进程接管过来,避免产生内存泄漏。

跟上一篇讲的僵尸进程的原理是差不多的,只是父进程的状态差异。

环境变量

概念

环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数 如:我们在编写C/C++代码的时候,在链接的时候,从来不知道我们的所链接的动态静态库在哪里,但 是照样可以链接成功,生成可执行程序,原因就是有相关环境变量帮助编译器进行查找。 环境变量通常具有某些特殊用途,还有在系统当中通常具有全局特性

 怎么理解呢,我们linux下通常来讲就是一堆堆的文件,指令还有函数这些,都是一个个的文件,我们yum install从远程服务端口下载的指令,比如tree,也是被放在了系统下的一个路径里面

我给大家看一下,比如ls

一般来说系统级的指令都在/usr/bin路径下,大家可以自己看一下

所以说,我们的指令其实是一个个的文件,包括我们的下载的指令,那么,这跟环境变量有什么关系呢,环境变量,就是在我们的linux下,查找我们的指令以及文件所在的路径,然后给到操作系统去运行

常见环境变量

PATH : 指定命令的搜索路径

HOME : 指定用户的主工作目录(即用户登陆到Linux系统中时,默认的目录)

SHELL : 当前Shell,它的值通常是/bin/bash。

查看环境变量方法     echo $NAME    //NAME:你的环境变量名称

 我们先写个简单的代码看看path的作用

#include <stdio.h>

int main()

{

printf("hello world!\n");

return 0;

}

我们看看./hello 执行和直接  hello执行的区别

 

这里的报错是因为path没有找到我们文件的路径,在我们平时运行的时候,我们都是./加文件名运行的,而ls,touch这些指令则是可以直接运行

这是因为我们的path是系统的环境变量,而这些指令保存在我们的path环境变量下,path通过路径寻找到我们对应的指令,然后执行这个指令文件的功能,按照这个说法,我们的文件也是可以直接运行的,只要我们能够加载到path指定的路径下。

 大家有兴趣自己试一下,我装了半天,电脑有点小问题

将我们的程序所在路径加入环境变量PATH当中, export PATH=$PATH:hello程序所在路径

 echo $PATH查看我们的路径是否包含在下面

 对比./hello执行和之间hello执行

为什么有些指令可以直接执行,不需要带路径,而我们的二进制程序需要带路径才能执行? 将我们的程序所在路径加入环境变量PATH当中, export PATH=$PATH:hello程序所在路径

还有什么方法可以不用带路径,直接就可以运行呢?

将程序放到PATH路径下

第一种方法就是将我们自己的程序放到PATH中的路径中去,这样在shell输入hello时,也能找到,例如我们将其放在/bin目录下:

$ hello
hello world
$ whereis hello
hello: /bin/hello

也就是说,如果你的程序安装在了PATH指定的路径,就需要配置PATH环境变量,在命令行输入就可以直接找到了。

设置PATH环境变量

那么如果想在指定的目录能够直接运行呢?很简单,那就是添加环境变量,例如将当前路径加入到PATH中:

$ PATH=$PATH:./   #这种方式只在当前shell有效,所有shell生效可修改/etc/profile文件
$ hello
hello world
设置别名

例如:

$ alias hello="/temp/hello"
$ hello
hello world

以上三种方法都可以达到目的。

测试HOME

1. 用root和普通用户,分别执行 echo $HOME ,对比差异

2.执行 cd ~; pwd ,对应 ~ 和 HOME的关系 

 我们可以看到,两个其实是差不多的,取决于你在哪个用户环境下使用而已。

环境变量相关的命令

1.echo: 显示某个环境变量值
2. export: 设置一个新的环境变量
3. env: 显示所有环境变量
4. unset: 清除环境变量
5. set: 显示本地定义的shell变量和环境变量

 环境变量的组织方式

每个程序都会收到一张环境表,环境表是一个字符指针数组,每个指针指向一个以’\0’结尾的环境字符串 

通过代码如何获取环境变量

命令行第三个参数(就是环境参数)

#include <stdio.h>
 int main(int argc, char *argv[], char *env[])
 {
    int i = 0;
    for(; env[i]; i++){
        printf("%s\n", env[i]);
    }
    return 0;
 }

通过第三方变量environ获取,指向我们的环境表,相当于二级指针

#include <stdio.h>
 
int main(int argc, char *argv[])
 {
    extern char **environ;
    int i = 0;
    for(; environ[i]; i++){
        printf("%s\n", environ[i]);
    }
    return 0;
 }

 libc中定义的全局变量environ指向环境变量表,environ没有包含在任何头文件中,所以在使用时 要用extern声明。

通过系统调用获取环境变量

#include <stdio.h>
 #include <stdlib.h>
 
int main()
 {
    printf("%s\n", getenv("PATH"));
    return 0;
 }

常用getenv和putenv函数来访问特定的环境变量。

环境变量通常是具有全局属性的

环境变量通常具有全局属性,可以被子进程继承下去

#include <stdio.h>
 #include <stdlib.h>
 
int main()
 {
    char * env = getenv("MYENV");
    if(env){
        printf("%s\n", env);
    }
    return 0;
 }

这个时候我们直接查看,发现没有结果,说明该环境变量根本不存在

导出环境变量
export MYENV="hello world"
再次运行程序,发现结果有了!说明:环境变量是可以被子进程继承下去的!

如果只进行MYENV=“helloworld” ,不调用export导出,在用我们的程序查看,会有什么结果?为什 么? 

如果只是直接设置环境变量 MYENV="helloworld" 而没有使用 export 命令导出该环境变量,然后再运行程序查看环境变量的取值,结果可能会是程序无法获取到正确的环境变量值。这是因为在不使用 export 命令导出环境变量时,该环境变量只在当前 shell 进程中有效,而不会被传递给程序的执行环境。

具体来说,当你直接设置环境变量 MYENV="helloworld" 时,该环境变量只会存在于当前 shell 进程中,而不会被传递给程序的执行环境。因此,当你运行程序时,程序尝试通过 getenv("MYENV") 函数获取环境变量的值时,由于该环境变量并未在程序的执行环境中被正确设置,程序将无法获得正确的环境变量值,结果可能是空值或者 null。

为了让程序能够正确获取环境变量的值,需要使用 export 命令将环境变量导出,使其成为子进程可见的环境变量。只有通过 export 命令导出的环境变量才能被程序正确识别和获取。

进程优先级

概念

cpu资源分配的先后顺序,就是指进程的优先权(priority)。

优先权高的进程有优先执行权利。

配置进程优先权对多任务环境的linux很有用,可以改善系统性能。

还可以把进程运行到指定的CPU上,这样一来,把不重要的进程安排到某个CPU,可以大大改善系统整 体性能。

一般来说,我们现在的电脑环境下,所启动进行的进程优先级都是一样的,所以这个部分主要是理解为主。

查看系统进程

在linux或者unix系统中,用ps –l命令则会类似输出以下几个内容:

这几个信息跟我们的进程优先级可以说有直接的关系

UID : 代表执行者的身份

PID : 代表这个进程的代号

PPID :代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号

PRI :代表这个进程可被执行的优先级,其值越小越早被执行

NI :代表这个进程的nice值

PRI and  NI

PRI也还是比较好理解的,即进程的优先级,或者通俗点说就是程序被CPU执行的先后顺序,此值越小 进程的优先级别越高 那NI呢?就是我们所要说的nice值了,其表示进程可被执行的优先级的修正数值 PRI值越小越快被执行,那么加入nice值后,将会使得PRI变为:PRI(new)=PRI(old)+nice 这样,当nice值为负值的时候,那么该程序将会优先级值将变小,即其优先级会变高,则其越快被执行 所以,调整进程优先级,在Linux下,就是调整进程nice值 nice其取值范围是-20至19,一共40个级别。 

需要强调一点的是,进程的nice值不是进程的优先级,他们不是一个概念,但是进程nice值会影响到进 程的优先级变化。 可以理解nice值是进程优先级的修正修正数据

用top命令更改已存在进程的nice:

top          进入top后按“r”–>输入进程PID–>输入nice值 

比如说我要修改22进程的nice值,就是top进入我们的这歌页面,然后r一下,就会有命令窗口,输入22,然后回车,这个时候呢我写入一个60吧,方便我们学习

 我们的nice最大是19,我们原来是-20,所以60-40=20,那么pri是不是20+19=39呢?

并不是,pri每个人的峰值可能不太一样,我的是39最大,pri=之前的pri加nice值,之前的pri是0,加nice值应该是19啊!为什么呢,因为这里有一个bug,pri更改默认是20,所以我们才会看到39这个数值

我现在把60减掉再用40给大家演示一下,一样是39的pri

 

我们使用的时候注意一下就好了,一般也不会更改优先级

相关知识点

竞争性: 系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争属性的。为了高 效完成任务,更合理竞争相关资源,便具有了优先级

独立性: 多进程运行,需要独享各种资源,多进程运行期间互不干扰

并行: 多个进程在多个CPU下分别,同时进行运行,这称之为并行

并发: 多个进程在一个CPU下采用进程切换的方式,在一段时间之内,让多个进程都得以推进,称之为 并发

程序地址空间

我们看一下c语言下的地址空间布局

可能我们对他并不理解!

#include <stdio.h>
 #include <unistd.h>
 #include <stdlib.h>
 
int g_val = 0;
 
int main()
 {
    pid_t id = fork();
    if(id < 0){
        perror("fork");
        return 0;
    }
    else if(id == 0){ //child
  printf("child[%d]: %d : %p\n", getpid(), g_val, &g_val);
    }else{ //parent
        printf("parent[%d]: %d : %p\n", getpid(), g_val, &g_val);
    }
    sleep(1);
    return 0;
 }

我们试一下从代码的角度去理解

有没有发现,地址是一样的啊

输出出来的变量值和地址是一模一样的,很好理解呀,因为子进程按照父进程为模版,父子并没有对变 量进行进行任何修改。

我们继续看,小改一下

我们发现,父子进程,输出地址是一致的,但是变量内容不一样!能得出如下结论:

变量内容不一样,所以父子进程输出的变量绝对不是同一个变量

但地址值是一样的,说明,该地址绝对不是物理地址!

在Linux地址下,这种地址叫做 虚拟地址

我们在用C/C++语言所看到的地址,全部都是虚拟地址!

物理地址,用户一概看不到,由OS统一管理

OS必须负责将 虚拟地址 转化成 物理地址 。

所以之前说‘程序的地址空间’是不准确的,准确的应该说成 进程地址空间

同一个变量,地址相同,其实是虚拟地址相同,内容不同其实是被映射到了 不同的物理地址!

 


写的不太好,表达能力确实不行,我会尽量除了我能看明白再写清楚的,阿里嘎都~

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-03-26 01:44:01       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-03-26 01:44:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-03-26 01:44:01       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-03-26 01:44:01       20 阅读

热门阅读

  1. 递归——N皇后

    2024-03-26 01:44:01       18 阅读
  2. Python中图片的切块与合并

    2024-03-26 01:44:01       16 阅读
  3. 深度学习中一些常见的问题

    2024-03-26 01:44:01       18 阅读
  4. 【C++】学习记录--condition_variable 的使用

    2024-03-26 01:44:01       18 阅读
  5. Docker部署springboot项目

    2024-03-26 01:44:01       19 阅读
  6. sql jdbc测试

    2024-03-26 01:44:01       16 阅读
  7. Android adb命令发送广播介绍

    2024-03-26 01:44:01       16 阅读
  8. C++初阶:浅识内存管理

    2024-03-26 01:44:01       17 阅读
  9. leetcode2549--统计桌面上的不同数字

    2024-03-26 01:44:01       19 阅读
  10. vue 中 清除form 校验状态

    2024-03-26 01:44:01       19 阅读
  11. C#使用ASP.NET Core Razor Pages构建网站(三)

    2024-03-26 01:44:01       25 阅读