Linux 进程状态、僵尸进程与孤儿进程

news/2024/10/5 14:03:04 标签: linux, 运维, 服务器

目录

0.前言

1. 进程状态

1.1 定义

1.2 常见进程

2.僵尸进程

2.1 定义

2.2 示例

2.3 僵尸进程的危害与防止方法

3. 孤儿进程

3.1 介绍

3.2 示例

4.小结


(图像由AI生成) 

0.前言

在上一篇文章中,我们介绍了进程的基本概念、进程控制块(PCB)以及如何查看 Linux 系统中的进程状态。这一篇,我们将继续深入探讨进程的各种状态,尤其是僵尸进程和孤儿进程等特殊情况,这些知识对于理解 Linux 系统中的进程管理和资源分配至关重要。

1. 进程状态

1.1 定义

在 Linux 中,进程的状态是进程当前所处的活动阶段或状态的指示。这一状态的定义在 Linux 内核源码中用 task_struct 结构体中的 state 字段表示。这个字段是一个位图,表示进程在何种情况下进行等待或执行操作。内核中的进程状态通过常量数组 task_state_array[] 定义,如下所示:

/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
    "R (running)",       /* 0 */
    "S (sleeping)",      /* 1 */
    "D (disk sleep)",    /* 2 */
    "T (stopped)",       /* 4 */
    "t (tracing stop)",  /* 8 */
    "X (dead)",          /* 16 */
    "Z (zombie)",        /* 32 */
};

通过这个数组,Linux 内核能够为不同状态的进程进行标识,每个状态都有不同的含义:

  • R (running):表示进程正在运行或准备运行。这是一个活动状态,进程在 CPU 上获得执行时间或正在等待被调度。

  • S (sleeping):表示进程正在睡眠,通常是因为它在等待某个事件发生,比如等待输入/输出(I/O)操作的完成。当条件满足时,进程会被唤醒并恢复运行。

  • D (disk sleep):表示进程处于不可中断的睡眠状态,通常是在等待硬件资源(如磁盘 I/O)的响应。这种状态下的进程不会响应任何信号,除非硬件操作完成。

  • T (stopped):表示进程已被暂停,通常是由用户通过发送 SIGSTOPSIGTSTP 信号来停止进程的执行。进程在这种状态下不会继续执行任何操作,直到接收到继续信号(如 SIGCONT)。

  • t (tracing stop):表示进程被调试器跟踪并暂停执行。调试器可以通过此状态检查进程的运行情况,并可以继续、停止或修改进程的执行。

  • X (dead):表示进程已终止并且即将从系统中清除,通常意味着进程已经彻底退出,内存和资源已释放。

  • Z (zombie):表示僵尸进程,即进程已经结束执行,但其父进程还没有通过 wait() 系统调用获取其退出状态。僵尸进程只保留进程控制块(PCB),不再消耗其他系统资源。

1.2 常见进程

在日常使用 Linux 系统时,上述这些状态中的几种是比较常见的。让我们详细介绍其中几种常见的进程状态:

  1. 运行(R (running)
    这是最活跃的状态,进程处于运行中,意味着该进程正在使用 CPU 资源。即使进程等待 CPU 调度,只要它准备好执行,仍会被标记为 R 状态。这也是大多数活跃进程的正常状态。

  2. 可中断睡眠(S (sleeping)
    这是最常见的等待状态,表示进程正在等待某些条件(如 I/O 完成)。当等待条件满足后,进程将自动被唤醒,恢复执行。使用 pstop 命令时,许多系统后台进程经常处于这种状态。

  3. 不可中断睡眠(D (disk sleep)
    进程处于深度睡眠中,通常在等待某些阻塞的硬件操作(例如磁盘 I/O)。这种状态下的进程无法被信号唤醒,必须等到请求的操作完成。此状态比较罕见,出现时通常与系统 I/O 瓶颈或硬件问题相关。

  4. 停止(T (stopped)
    停止状态的进程通常是被用户手动暂停的。通过 Ctrl+Zkill -STOP 可以将进程送入此状态,典型应用场景是在调试时或暂时停止某些前台任务。

  5. 僵尸(Z (zombie)
    僵尸进程虽然很少见,但却是系统管理中需要注意的一种状态。它们不会消耗系统资源,但过多的僵尸进程可能导致进程号耗尽,系统无法再创建新的进程。

2.僵尸进程

2.1 定义

僵尸进程(Zombie Process)是指一个进程已经完成了它的执行(通过调用 exit() 退出),但它的父进程还没有调用 wait() 系统调用获取它的退出状态。此时,子进程的进程控制块(PCB)依然保存在内存中,等待父进程来回收它的退出信息。在 Linux 中,每个进程都需要一个进程号(PID),如果僵尸进程不被处理,系统将保留它们的 PID,导致可用的 PID 资源被耗尽,最终可能影响系统的正常运行。

僵尸进程本身并不会占用过多的系统资源,但如果产生大量僵尸进程,可能会导致系统进程号耗尽,影响新进程的创建。一般情况下,僵尸进程应该尽快通过父进程调用 wait() 系列函数来处理和回收。

2.2 示例

下面我们通过一个简单的 C 语言代码示例来演示如何创建一个僵尸进程。此代码会创建一个子进程,子进程立即退出,但父进程不调用 wait(),从而让子进程进入僵尸状态。

C语言创建僵尸进程的例子

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>

int main() {
    pid_t pid = fork();

    if (pid > 0) {
        // 父进程睡眠一段时间,以便子进程进入僵尸状态
        sleep(30); // 这里父进程故意不调用 wait(),让子进程变成僵尸
    } else if (pid == 0) {
        // 子进程立即退出
        printf("子进程 (PID: %d) 已经退出,但父进程未调用 wait(),它将成为僵尸进程。\n", getpid());
        exit(0);
    } else {
        // fork 失败
        perror("fork");
        exit(1);
    }

    return 0;
}

在这个示例中,父进程 fork() 出一个子进程,然后父进程进入睡眠状态,而子进程立即 exit() 退出。由于父进程没有调用 wait(),子进程的状态将变为僵尸状态,直到父进程被唤醒并调用 wait() 函数处理它。

我们可以通过 Linux 中的命令行脚本实时查看该进程的状态。以下是一个简单的命令行脚本,它会每秒钟打印一次所有进程的状态,以便实时监控僵尸进程:

实时监控进程状态的脚本

#!/bin/bash

# 使用 ps 命令每秒钟查看进程的状态
while true; do
    clear
    ps -eo pid,ppid,stat,cmd | grep '[Zz]'
    sleep 1
done

这个脚本使用 ps -eo pid,ppid,stat,cmd 命令来打印出所有进程的进程号、父进程号、状态和命令。grep '[Zz]' 会过滤出所有处于僵尸状态的进程。脚本会每秒执行一次,显示系统中当前的僵尸进程。运行这个脚本时,用户可以观察到子进程在退出后变成僵尸进程,并在父进程睡眠期间保持僵尸状态。

2.3 僵尸进程的危害与防止方法

僵尸进程的主要危害并不在于它们占用了大量的系统资源,而是:

  1. 占用进程号:每个进程在系统中都有一个唯一的进程号(PID)。系统中的 PID 数量是有限的,过多的僵尸进程会消耗这些可用的进程号,导致系统在需要创建新进程时无法分配新的 PID。如果系统中存在大量僵尸进程,将导致系统无法创建新的进程,从而影响系统的正常运行。

  2. 系统管理复杂化:僵尸进程虽然不占用 CPU 和内存,但它们会增加系统中进程的数量,给系统管理员带来困扰。在 pstop 这样的命令中,这些僵尸进程会持续存在,使得进程管理和问题排查变得更加复杂。

  3. 资源泄露风险:虽然僵尸进程只保留了少量信息,但如果父进程长期不处理这些僵尸进程,相关资源无法完全释放,尤其在一些复杂的进程间通信或多进程的应用中,可能导致资源泄露或系统资源耗尽。

如何防止僵尸进程

  • 父进程主动调用 wait()waitpid():父进程应当及时调用这些函数来处理子进程的退出状态,避免子进程变为僵尸状态。
  • 使用信号处理机制:父进程可以设置 SIGCHLD 信号处理程序,当子进程结束时自动调用 wait() 来清理僵尸进程。
  • init 进程接管:当父进程终止时,孤儿进程会自动被 init 进程接管,init 进程会负责处理这些子进程,避免僵尸状态的出现。

3. 孤儿进程

3.1 介绍

孤儿进程(Orphan Process)是指其父进程已经终止,但子进程仍在继续运行的进程。当父进程退出后,系统自动将这些孤儿进程的父进程重定向为 init 进程(在大多数 Linux 系统中,PID 为 1),由 init 进程负责管理它们。因此,孤儿进程并不会对系统造成问题,init 进程会在这些孤儿进程终止时回收它们的资源。

孤儿进程本身并不是错误或需要纠正的状态,更多情况下,它是一种自然现象。例如,当某个后台服务的父进程意外终止时,子进程继续执行,成为孤儿进程并由 init 进程接管。这种机制确保了系统的稳定性,防止了因为父进程退出而造成的子进程资源泄漏。

3.2 示例

为了更好地理解孤儿进程的工作方式,我们通过一个 C 语言示例代码来演示孤儿进程的生成和处理过程。在此示例中,父进程创建一个子进程,父进程立即终止,而子进程继续运行并成为孤儿进程。

C语言创建孤儿进程的例子

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();

    if (pid > 0) {
        // 父进程
        printf("父进程 (PID: %d) 正在退出...\n", getpid());
        exit(0);  // 父进程退出,子进程将成为孤儿进程
    } else if (pid == 0) {
        // 子进程
        printf("子进程 (PID: %d, PPID: %d) 开始运行\n", getpid(), getppid());
        sleep(5);  // 子进程等待几秒,观察它成为孤儿进程的状态
        printf("子进程 (PID: %d, PPID: %d) 仍然在运行,并已成为孤儿进程\n", getpid(), getppid());
        exit(0);
    } else {
        // fork 失败
        perror("fork");
        exit(1);
    }

    return 0;
}

解释

  1. 父进程通过调用 fork() 创建了一个子进程。
  2. 父进程立即调用 exit() 终止自身,使得子进程成为孤儿进程。
  3. 子进程在父进程退出后继续执行,并等待 5 秒,确保自己成为孤儿进程。
  4. 子进程打印出自己在成为孤儿进程后的状态,父进程的 PID 变为 1,表示 init 进程已经接管了它。

从输出中可以看到,子进程在父进程退出后继续运行,且子进程的父进程 ID (PPID) 变为 1,说明它已经被 init 进程接管。这就是孤儿进程的典型处理过程。

孤儿进程通常不会给系统带来危害,因为 init 进程会自动管理它们。

4.小结

本篇文章我们深入探讨了 Linux 系统中的进程状态,了解了系统如何管理进程的不同阶段。尤其是僵尸进程和孤儿进程这两种特殊进程状态,在日常的系统管理和故障排查中经常遇到。理解这些概念不仅有助于我们优化系统资源的使用,还能够在需要时快速定位和处理系统中潜在的问题。对于僵尸进程,关键在于父进程的正确处理;对于孤儿进程,系统的 init 进程会自动接管,用户通常不需要过多干预。


http://www.niftyadmin.cn/n/5690986.html

相关文章

小米 MIX FOLD工程固件 更换字库修复分区 资源预览与刷写说明

小米 MIX FOLD机型代号 :cetus 该手机搭载骁龙888旗舰处理器 。对于一些因为字库问题损坏导致的故障,更换字库后要先刷写对应的工程底层修复固件。绑定cpu后在写入miui量产固件。 通过博文了解 1💝💝💝-----此机型工程固件的资源刷写注意事项 2💝💝💝-----此…

通过 Caddy2 部署 WebDAV 服务器

今天我们在阿贝云的免费服务器上进行一次有趣的部署测试。阿贝云提供的这款免费云服务器&#xff0c;虽然配置为1核CPU、1G内存、10G硬盘、5M带宽&#xff0c;但其稳定性和易用性让人惊喜&#xff0c;真是不错的免费服务器&#xff01;无论是小项目还是实验环境&#xff0c;阿贝…

前端Vue项目的自动打包、上传与部署

文章目录 前言思路与流程脚本实现1. 打包前端项目2. 上传前端项目4. 传递密码5. 代码优化完整脚本结语前言 在实际项目开发中,并不是所有项目都会配置 CI/CD 流程,特别是在中小型团队或者公司内部测试环境中,很多时候我们仍然需要手动打包、上传和部署项目。这个过程虽然简…

(Django)初步使用

前言 Django 是一个功能强大、架构良好、安全可靠的 Python Web 框架&#xff0c;适用于各种规模的项目开发。它的高效开发、数据库支持、安全性、良好的架构设计以及活跃的社区和丰富的文档&#xff0c;使得它成为众多开发者的首选框架。 目录 安装 应用场景 良好的架构设计…

职场祛魅:判断2B企业和外包公司?

长假期间有初入职场的小伙伴跟猫哥聊天&#xff0c;说起来外包公司&#xff0c;并认为&#xff1a;外包公司也为企业提供服务&#xff0c;2B从名字上判断就是为企业服务的。 一、怎么判断一个企业是2B而不是外包&#xff1f; 以下是猫哥从业N年的一点粗浅认识&#xff1a; 要…

C语言复习概要(二)

本文目录 C语言中的数组与函数详解1. 引言2. 数组2.1. 什么是数组&#xff1f;语法&#xff1a;示例&#xff1a; 2.2. 数组的初始化示例 1&#xff1a;在声明时初始化示例 2&#xff1a;部分初始化示例 3&#xff1a;运行时赋值 2.3. 数组的访问与修改示例&#xff1a; 2.4. 多…

web网页项目--用户登录,注册页面代码

index.html <!DOCTYPE html> <html lang"zxx"><head><title>xxx注册</title><!-- Meta tags --><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0&q…

yjs11——pandas运算

1.算术运算 加法&#xff1a; data.&#xff08;列名.&#xff09;add(k) data&#xff08;.列&#xff09; k 减法&#xff1a; data["W"].sub(k)注意&#xff1a; data["列名"]的效果data.列名 2.逻辑运算 2.1直接比较型满足条件赋值 2.2函数型&#x…