【从浅学到熟知Linux】进程间通信之匿名管道方式(进程间通信方式汇总、匿名管道的创建、匿名管道实现进程池详解)

在这里插入图片描述

🏠关于专栏:Linux的浅学到熟知专栏用于记录Linux系统编程、网络编程等内容。
🎯每天努力一点点,技术变化看得见


进程间通信介绍

如何实现进程间通信

  • 什么是通信?
    所谓通信,就是要实现两个或多个进程实现数据层面的交互。而在操作系统中,为了保持进程的独立性,不允许其他进程访问某个进程的地址空间。正因为进程独立性的存在,导致进程的通信成本比较高。(因为A进程无法直接将通信数据写入B进程的地址空间中,而需要通过在两进程外部创建某个空间来实现进程的通信,故成本较高)。
  • 为什么进程需要通信呢?
    ①数据传输:一个进程需要将它的数据发送给另一个进程;
    ②资源共享:多个进程之间共享同样的数据,当前进程需要将共享数据发送给需要该数据的进程;
    ③通知事件:一个进程需要向另一个或一组进程发送消息,通知它(它们)发送了某种事件(如:子进程退出时需要通知父进程);
    ④进程控制:有些进程希望完全控制另一个进程的执行,控制进程希望能够知道另一个进程的状态改变,通过状态来确定如何控制。
  • 实现进程间通信的思想是什么呢?
    ①进程间通信的本质,必须让不同的进程看到同一份进程外的“资源”(A进程向该资源写入信息,B进程从该资源中读取,从而实现通信);
    ②“资源”就是特定形式的内存空间;
    ③这个“资源”谁提供?一般是操作系统提供的第三方空间。
    ④由于该空间是操作系统提供的,则通信进程访问该空间进行通信,本质就是访问操作系统。进程处于用户,而“资源”属于操作系统,即内核级。故该“资源”从创建、使用、到释放,都需要操作系统参与,因而操作系统需要提供对应的系统调用。一般操作系统会提供一个独立的通信系统——LPC通信模块(隶属于文件系统)。

★ps:为什么不是通信的两个进程中的一个,提供通信的“资源”呢?如果由A进程提供,则该资源属于A进程。若想实现通信,则B进程也要访问这个空间,则会破坏进程独立性。

进程间通信分类

进程间通信方式可以分为3类:管道、System V IPC、POSIX IPC三种方式。其中,System V版本常用于本机进程间通信,而POSIX版本常用于网络中不同主机间的进程间通信。

以下是上述三类通信方式包含的具体通信形式↓↓↓

管道方式

● 匿名管道pipe
● 命名管道fifo

System V IPC

● System V消息队列
● System V共享内存
● System V信号量

POSIX IPC

● 消息队列
● 共享内存
● 信号量
● 互斥量
● 条件变量
● 读写锁

上述列出的各个通信形式,将于本文及后序文章中陆续介绍,本文先介绍匿名管道。

管道通信方式

什么是管道

管道是Unix操作系统中最古老的进程间通信方式,我们将一个进程链接到另一个进程的数据流缓冲区称为一个“管道”。

【示例】当我们执行ps axj | grep test.c的时候,ps axj的标准输出结果写入到内核的管道中,grep test.c从该内核管道获取输入,将将结果输出给用户显示器。

在这里插入图片描述
★ps:建立通信为什么那么费劲?因为进程具有独立性。

匿名管道pipe

在这里插入图片描述

创建匿名管道的系统调用原型为int pipe(int pipefd[2]);。参数pipefd是文件描述符数组,其中pipefd[0]表示读端,pipefd[1]表示写端。

在这里插入图片描述
从上图可以看出,当需要进行通信时,需要通过pipefd[1]文件描述符,将数据拷贝到管道文件中;再通过pipefd[0]文件描述符,将管道文件中的数据拷贝到用户空间中。因而,管道通信时,需要产生两次拷贝

下面是一个进程向管道内写入数据,并从管道内读取数据的代码↓↓↓

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>

int main()
{
	int fds[2];
	pipe(fds);	//创建匿名管道
	
	//向匿名管道文件中写入数据
	char* msg = "Jammingpro";
	write(fds[1], msg, strlen(msg));

	//从匿名管道文件中读取输入
	char buffer[1024];
	ssize_t n = read(fds[0], buffer, sizeof(buffer));
	buffer[n] = '\0';
	printf("The info read from pipe is %s\n", buffer);
	return 0;
}

在这里插入图片描述

但我们创建匿名的目的是为了实现进程间的通信,在同一个进程内读写匿名管道文件并没有多大意义。由于匿名管道只能实现具有血缘关系的进程进行通信(如父子进程、兄弟进程、爷孙进程等具有血缘关系的进程),下面我们来探索父子进程如何进行匿名管道通信。↓↓↓

当父进程创建匿名管道时,则会在父进程的文件描述符表中,为匿名管道的读端和写端各分配一个文件描述符。
在这里插入图片描述
当父进程fork创建子进程时,子进程会继承父进程的文件描述符表,即子进程的3号和4号文件符和父进程一样,指向刚刚创建的匿名管道的读写端。
在这里插入图片描述

在这里插入图片描述
若我们希望子进程向父进程发送数据,则对于父进程来说,管道的写文件描述符的存在是没有意义的;对于子进程来说,管道的读文件描述符是没有意义的。我们可以将父进程的写文件描述符pipefd[1]和子进程读文件描述符pipefd[0]关闭。

在这里插入图片描述
在这里插入图片描述

下面我们实现一个子进程向父进程发送数据的代码↓↓↓

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <stdbool.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/wait.h>

int main()
{
	int fds[2];
	pipe(fds);

	pid_t id = fork();
	if(id == 0)//子进程
	{
		close(fds[0]);
		int cnt = 10;
		while(cnt--)
		{
			char buffer[1024];
			snprintf(buffer, sizeof(buffer), "%d->child process sending a message", cnt);
			write(fds[1], buffer, strlen(buffer));
			sleep(1);
		}
		close(fds[1]);
		exit(0);
	}
	//父进程
	close(fds[1]);
	char info[1024];
	while(true)
	{
		ssize_t n = read(fds[0], info, sizeof(info) - 1);
		if(n != 0)
		{
			info[n] = '\0';
			printf("get a info from child process! --> %s\n", info);
		}
		else
		{
			close(fds[0]);
			break;
		}
	}

	int status = 0;
	pid_t ret = waitpid(id, &status, 0);
	if(WIFEXITED(status))
	{
		printf("exitcode = %d, sig = %d\n", WEXITSTATUS(status), (status & 0x7F));
	}
	return 0;
}

在这里插入图片描述
上面代码中,子进程每间隔1秒向管道中写入一条数据,我们并没有对父进程做任何限制。但父进程却可以实现每隔一秒从管道中读取数据。并且,子进程在写入时,父进程并没有立即读取,而是等子进程写完才读取(如果子进程在写的时候,父进程就开始读,就会出现读取的数据不完整的情况)。

由上面代码执行结果可知,管道具有同步机制,即只有写端写入数据后,读端才能读取,读写存在先后顺序。当读写端均正常时,写端没有写入时,读端会阻塞等待。当写端文件描述符关闭时,读端read返回结果为0,表示读到文件末尾。

那如果我们让读端每隔1秒读一次,写端不限制,则会出现什么情况呢↓↓↓

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <stdbool.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/wait.h>

int main()
{
	int fds[2];
	pipe(fds);

	pid_t id = fork();
	if(id == 0)//子进程
	{
		close(fds[0]);
		int cnt = 100;
		while(cnt--)
		{
			char buffer[1024];
			snprintf(buffer, sizeof(buffer), "%d->child process sending a message", cnt);
			write(fds[1], buffer, strlen(buffer));
		}
		close(fds[1]);
		exit(0);
	}
	//父进程
	close(fds[1]);
	char info[1024];
	while(true)
	{
		ssize_t n = read(fds[0], info, sizeof(info) - 1);
		if(n != 0)
		{
			info[n] = '\0';
			printf("get a info from child process! --> %s\n", info);
		}
		else
		{
			close(fds[0]);
			break;
		}
		sleep(10);
	}

	int status = 0;
	pid_t ret = waitpid(id, &status, 0);
	if(WIFEXITED(status))
	{
		printf("exitcode = %d, sig = %d\n", WEXITSTATUS(status), (status & 0x7F));
	}
	return 0;
}

在这里插入图片描述
由上面程序执行结果可以看出,当读端没有读取匿名管道文件中的数据时,写端将匿名管道文件写满后,只能阻塞等待,待读端将数据读走后,才能继续写入。

由上面的程序执行结果我们可以得出,当读写端正常时,读端读的慢,则写端写满管道文件后会阻塞等待。

同时,从上面程序的执行结果来看。多次写入管道文件中的内容,被一次性读取出来,说明管道是基于字节流的。

那如果父进程的读端关闭,则写端会出现什么情况呢?↓↓↓

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <stdbool.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/wait.h>

int main()
{
	int fds[2];
	pipe(fds);

	pid_t id = fork();
	if(id == 0)//子进程
	{
		close(fds[0]);
		int cnt = 100;
		while(cnt--)
		{
			char buffer[1024];
			snprintf(buffer, sizeof(buffer), "%d->child process sending a message", cnt);
			write(fds[1], buffer, strlen(buffer));
			sleep(1);
		}
		close(fds[1]);
		exit(0);
	}
	//父进程
	close(fds[1]);
	char info[1024];
	int count = 0;
	while(true)
	{
		ssize_t n = read(fds[0], info, sizeof(info) - 1);
		if(n != 0)
		{
			info[n] = '\0';
			printf("get a info from child process! --> %s\n", info);
		}
		else
		{
			close(fds[0]);
			break;
		}
		if(count == 2)
		{
			close(fds[0]);
			break;
		}
		count++;
	}

	int status = 0;
	pid_t ret = waitpid(id, &status, 0);
	if(ret > 0)
	{
		printf("exitcode = %d, sig = %d\n", WEXITSTATUS(status), (status & 0x7F));
	}
	return 0;
}

在这里插入图片描述
上面程序中,当父进程读取3次管道文件内容后,将父进程的读端文件描述符关闭。由程序执行结果可以看到,子进程收到了13号信号,即SIGPIPE信号。

匿名管道读写规则

由上面的多个代码执行结果,我们可以得到如下结论↓↓↓

  1. 读写端正常,若管道如果为空,读端就要阻塞;
  2. 读写端正常,若管道如果被写满,写端被阻塞;
  3. 读端正常读,写端关闭,读端就会读到0,表明读到pipe文件末尾。这种情况,读端并不会阻塞。
  4. 写端正常写,读端关闭,操作系统会用13号信号SIGPIPE杀死系统中正在写入的进程。

多执行流共享,难免出现访问冲突。例如,A进程本想向管道中写入"Hello World",但当A进程写完"Hello"时,B进程就来读取,导致数据不完整。管道能提供协同机制(包含同步和互斥),对于同步来说,只有写端写入数据后,读端才能读取数据;对于互斥来说:先进来读写的进程要完成其读写任务后,下一个进程才能进行读写,不允许两个进程同时访问管道。

但对于管道的互斥机制来说,之后当管道内数据小于PIPE_BUF大小时,才能保证。当读写入的数据不大于PIPE_BUF时,Linux将可以保证写入的原子性,即保证写进程写入时没有进程读取,进程读取时没有其他进程写入。当读写数据大于PIPE_BUF大小时,Linux不再保证读写的原子性。

★ps:原子性操作表示只有两种结果的操作,这里的原子性读写操作表示读写成功或不进行读写。

管道的特点

  1. 具有血缘关系的进程才可以进行通信(常用于父子通信);
  2. 管道是半双工的,数据只能单向流动
  3. 父子进程是会进程协同的,匿名管道会提供同步与互斥机制——保护管道文件的数据安全;
  4. 管道提供面向流式的通信服务——面向字节流;
  5. 管道是基于文件的,而文件的生命周期是随进程的。当进程执行结束,则对应的匿名管道文件会被释放。

★ps:匿名管道只能让父子进程之间实现单向通信,如果我们需要实现双向通信,则需要使用两个管道。
在这里插入图片描述

★ps:如果两个进程不存在任何关系(不是父子进程、兄弟进程、爷孙进程等有血缘的关系),则这两个进程能不能通信呢?不能。进程之间必须有血缘关系,常用于父子进程。这种方式打开的管道文件,称为匿名管道。

管道是有固定大小的,不同内核里,大小可能有差异。我们可以使用ulimit -a查看当前系统中的匿名管道文件pipe的大小。↓↓↓在这里插入图片描述

匿名管道的应用——进程池

注意:进程池应用代码使用C++语言

当我们的系统中有大量的任务需要被处理时,我们可以将这些任务派发给各个子进程。但由于多次创建和销毁进程会带来较大的时间开销。我们可以通过提前创建一批子进程(避免需要时再创建),且子进程空闲时就阻塞等待(避免子进程执行完被销毁,下次需要子进程时还需要创建)。

实现上述需求时,我们需要借助匿名管道。通过在各个父子进程间建立匿名管道,实现父进程向指定子进程派发任务。↓↓↓

在这里插入图片描述
但需要注意的是,父进程不应该将大量任务集中派发给某个子进程,而让其他子进程处于空闲状态,这样会使得整机效率低下。我们可以通过轮询随机派发的方式给子进程派发任务,实现负载均衡。

要给子进程派发任务,我们就需要先拥有任务(Task.hpp)↓↓↓

#include <iostream>
#include <vector>

typedef void(*func_t)();

void task1()
{
	std::cout << "昭君一技能" << std::endl;
}

void task2()
{
	std::cout << "回城中..." << std::endl;
}

void task3()
{
	std::cout << "大招特效" << std::endl;
}

void task4()
{
	std::cout << "暴君降临" << std::endl;
}

void LoadTask(std::vector<func_t>& tasks)
{
	tasks.push_back(task1);
	tasks.push_back(task2);
	tasks.push_back(task3);
	tasks.push_back(task4);
}

当我们创建进程池时,需要保存各个子进程的写端、进程PID和进程名称(写端是必须保存的,后两者只是为了调试时方便),故我们可以创建一个channel类,用于保存子进程信息↓↓↓

//先描述
class channel
{
public:
    channel(int cmdfd, pid_t slaverid, std::string processname)
        :_cmdfd(cmdfd)
        ,_slaverid(slaverid)
        ,_processname(processname)
    {}

    int _cmdfd;      //发送任务的文件描述符
    pid_t _slaverid; //子进程的PID
    std::string _processname;    //子进程的名字——方便打印日志信息
};

下面给出子进程处理任务的函数(子进程fork之后循环执行该函数代码)↓↓↓

std::vector<func_t> tasks;

void slaver()
{
    while(true)
    {
        int cmdcode = 0;
        int n = read(0, &cmdcode, sizeof(int)); //如果父进程没有给子进程发送,子进程阻塞等待
        if(n == sizeof(int))
        {   
            std::cout << getpid() << "收到一个任务,并开始执行:" << std::endl;
            tasks[cmdcode]();
        }
        if(n == 0)
        {
            close(0);
            std::cout << getpid() << " quit" << std::endl;
            break;
        }
    }
    exit(0);
}

下面我们就要开始编写主体逻辑了,即进程池↓↓↓

std::vector<func_t> tasks;
const int processNum = 5;	//进程池中进程个数

void InitProcessPull(std::vector<channel> *channels)
{
    std::vector<int> wfd;
    for(int i = 0; i < processnum; i++)
    {
        int pipefd[2];      //临时空间
        int n = pipe(pipefd);
        assert(!n);
        (void)n;

        wfd.push_back(pipefd[1]);

        pid_t id = fork();
        if(id == 0) //child
        {
            for(auto e : wfd) close(e);
            dup2(pipefd[0], 0);
            slaver();
            exit(0);
        }
        //father
        close(pipefd[0]);

        //添加channel字段
        std::string name = "process-" + std::to_string(i);
        channels->push_back(channel(pipefd[1], id, name));
    }
}

下面函数用于给进程池中的进程派发任务↓↓↓

std::vector<func_t> tasks;
const int processNum = 5;
void distribute(const std::vector<channel>& channels)
{
    for(int i = 0; i < 10; i++)
    {
        //1.选择任务
        int cmdcode = rand() % tasks.size();
        //2.选择进程
        int processpos = rand() % channels.size();
        //3.发送任务
        write(channels[processpos]._cmdfd, &cmdcode, sizeof(int));
        sleep(1);
    }
}

下面是最终的进程池代码↓↓↓

#include "Task.hpp"
#include <iostream>
#include <string>
#include <vector>
#include <cstdlib>
#include <cassert>
#include <ctime>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

const int processnum = 5;
std::vector<task_t> tasks;

//先描述
class channel
{
public:
    channel(int cmdfd, pid_t slaverid, std::string processname)
        :_cmdfd(cmdfd)
        ,_slaverid(slaverid)
        ,_processname(processname)
    {}

    int _cmdfd;      //发送任务的文件描述符
    pid_t _slaverid; //子进程的PID
    std::string _processname;    //子进程的名字——方便打印日志信息
};

void slaver()
{
    while(true)
    {
        int cmdcode = 0;
        int n = read(0, &cmdcode, sizeof(int)); //如果父进程没有给子进程发送,子进程阻塞等待
        if(n == sizeof(int))
        {   
            std::cout << getpid() << "收到一个任务,并开始执行:" << std::endl;
            tasks[cmdcode]();
        }
        if(n == 0)
        {
            close(0);
            std::cout << getpid() << " quit" << std::endl;
            break;
        }
    }
    exit(0);
}

//输入:const &
//输出:*
//输入输出:&

void InitProcessPull(std::vector<channel> *channels)
{
    std::vector<int> wfd;
    for(int i = 0; i < processnum; i++)
    {
        int pipefd[2];      //临时空间
        int n = pipe(pipefd);
        assert(!n);
        (void)n;

        wfd.push_back(pipefd[1]);

        pid_t id = fork();
        if(id == 0) //child
        {
            for(auto e : wfd) close(e);
            dup2(pipefd[0], 0);
            slaver();
            exit(0);
        }
        //father
        close(pipefd[0]);

        //添加channel字段
        std::string name = "process-" + std::to_string(i);
        channels->push_back(channel(pipefd[1], id, name));
    }
}

void debug(std::vector<channel>& channels)
{
    for(auto &c : channels)
    {
        std::cout << c._cmdfd << " " << c._slaverid << " " << c._processname << std::endl;
    }
}

void distribute(const std::vector<channel>& channels)
{
    for(int i = 0; i < 10; i++)
    {
        //1.选择任务
        int cmdcode = rand() % tasks.size();
        //2.选择进程
        int processpos = rand() % channels.size();
        //3.发送任务
        write(channels[processpos]._cmdfd, &cmdcode, sizeof(int));
        sleep(1);
    }
}

void clean(const std::vector<channel>& channels)
{
    for(int i = 0; i < channels.size(); i++)
    {
        close(channels[i]._cmdfd);
        waitpid(channels[i]._slaverid, NULL, 0);
    }

    // 方式1
    // for(int i = 0; i < channels.size(); i++)
    // {
    //     close(channels[i]._cmdfd);
    // }
    // sleep(2);
    // for(int i = 0; i < channels.size(); i++)
    // {
    //     waitpid(channels[i]._slaverid, NULL, 0);
    // }
}

int main()
{
    srand(time(nullptr));   //种随机数种子
    LoadTask(&tasks);
    //在组织
    std::vector<channel> channels;
    //初始化
    InitProcessPull(&channels);
    //开始控制子进程
    //debug(channels);
    distribute(channels);
    //清理收尾
    clean(channels);
    return 0;
}

🎈欢迎进入从浅学到熟知Linux专栏,查看更多文章。
如果上述内容有任何问题,欢迎在下方留言区指正b( ̄▽ ̄)d

相关推荐

  1. 进程通信——匿名管道

    2024-04-23 01:28:02       17 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-23 01:28:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-23 01:28:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-23 01:28:02       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-23 01:28:02       20 阅读

热门阅读

  1. Unity3D 分块编辑小AStar地图详解

    2024-04-23 01:28:02       11 阅读
  2. 卸载并升级pytorch安装torcheval

    2024-04-23 01:28:02       13 阅读
  3. CV 面试指南—深度学习知识点总结(1)

    2024-04-23 01:28:02       15 阅读
  4. 前端CSS基础2(CSS基本选择器和复合选择器)

    2024-04-23 01:28:02       10 阅读
  5. 面试题

    面试题

    2024-04-23 01:28:02      16 阅读
  6. /bin/sh: 1: arm-linux-g++: not found

    2024-04-23 01:28:02       16 阅读
  7. 【Vue3源码学习】— CH3.2 VNode解析(上)

    2024-04-23 01:28:02       18 阅读
  8. leetcode 23

    2024-04-23 01:28:02       17 阅读
  9. lazarus-ide简介

    2024-04-23 01:28:02       17 阅读
  10. 安卓功耗分析

    2024-04-23 01:28:02       11 阅读
  11. Android开发——ListView

    2024-04-23 01:28:02       13 阅读
  12. mybatis和mybatis-plus的区别

    2024-04-23 01:28:02       15 阅读