linux進程組
1. linux 進程管理之進程調度與切換
我們知道,進程運行需要各種各樣的系統資源,如內存、文件、列印機和最
寶貴的 CPU 等,所以說,調度的實質就是資源的分配。系統通過不同的調度演算法(Scheling Algorithm)來實現這種資源的分配。通常來說,選擇什麼樣的調度演算法取決於資源分配的策略(Scheling Policy)。
有關調度相關的結構保存在 task_struct 中,如下:
active_mm 是為內核線程而引入的,因為內核線程沒有自己的地址空間,為了讓內核線程與普通進程具有統一的上下文切換方式,當內核線程進行上下文切換時,讓切換進來的線程的 active_mm 指向剛被調度出去的進程的 active_mm(如果進程的mm 域不為空,則其 active_mm 域與 mm 域相同)。
在 linux 2.6 中 sched_class 表示該進程所屬的調度器類有3種:
進程的調度策略有5種,用戶可以調用調度器里不同的調度策略:
在每個 CPU 中都有一個自身的運行隊列 rq,每個活動進程只出現在一個運行隊列中,在多個 CPU 上同時運行一個進程是不可能的。
運行隊列是使用如下結構實現的:
tast 作為調度實體加入到 CPU 中的調度隊列中。
系統中所有的運行隊列都在 runqueues 數組中,該數組的每個元素分別對應於系統中的一個 CPU。在單處理器系統中,由於只需要一個就緒隊列,因此數組只有一個元素。
內核也定義了一下便利的宏,其含義很明顯。
Linux、c/c++伺服器開發篇-------我們來聊聊進程的那些事
Linux內核 進程間通信組件的實現
學習地址:C/C++Linux伺服器開發/後台架構師【零聲教育】-學習視頻教程-騰訊課堂
需要C/C++ Linux伺服器架構師學習資料加qun812855908獲取(資料包括 C/C++,Linux,golang技術,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒體,CDN,P2P,K8S,Docker,TCP/IP,協程,DPDK,ffmpeg 等),免費分享
在分析調度流程之前,我們先來看在什麼情況下要執行調度程序,我們把這種情況叫做調度時機。
Linux 調度時機主要有。
時機1,進程要調用 sleep() 或 exit() 等函數進行狀態轉換,這些函數會主動調用調度程序進行進程調度。
時機2,由於進程的時間片是由時鍾中斷來更新的,因此,這種情況和時機4 是一樣的。
時機3,當設備驅動程序執行長而重復的任務時,直接調用調度程序。在每次反復循環中,驅動程序都檢查 need_resched 的值,如果必要,則調用調度程序 schele() 主動放棄 CPU。
時機4 , 如前所述, 不管是從中斷、異常還是系統調用返回, 最終都調用 ret_from_sys_call(),由這個函數進行調度標志的檢測,如果必要,則調用調用調度程序。那麼,為什麼從系統調用返回時要調用調度程序呢?這當然是從效率考慮。從系統調用返回意味著要離開內核態而返回到用戶態,而狀態的轉換要花費一定的時間,因此,在返回到用戶態前,系統把在內核態該處理的事全部做完。
Linux 的調度程序是一個叫 Schele() 的函數,這個函數來決定是否要進行進程的切換,如果要切換的話,切換到哪個進程等。
從代碼分析來看,Schele 主要完成了2個功能:
進程上下文切換包括進程的地址空間的切換和執行環境的切換。
對於 switch_mm 處理,關鍵的一步就是它將新進程頁面目錄的起始物理地址裝入到寄存器 CR3 中。CR3 寄存器總是指向當前進程的頁面目錄。
switch_to 把寄存器中的值比如esp等存放到進程thread結構中,保存現場一邊後續恢復,同時調用 __switch_to 完成了堆棧的切換。
在進程的 task_struct 結構中有個重要的成分 thread,它本身是一個數據結構 thread_struct, 裡面記錄著進程在切換時的(系統空間)堆棧指針,取指令地址(也就是「返回地址」)等關鍵性的信息。
關於__switch_to 的工作就是處理 TSS (任務狀態段)。
TSS 全稱task state segment,是指在操作系統進程管理的過程中,任務(進程)切換時的任務現場信息。
linux 為每一個 CPU 提供一個 TSS 段,並且在 TR 寄存器中保存該段。
linux 中之所以為每一個 CPU 提供一個 TSS 段,而不是為每個進程提供一個TSS 段,主要原因是 TR 寄存器永遠指向它,在任務切換的適合不必切換 TR 寄存器,從而減小開銷。
在從用戶態切換到內核態時,可以通過獲取 TSS 段中的 esp0 來獲取當前進程的內核棧 棧頂指針,從而可以保存用戶態的 cs,esp,eip 等上下文。
TSS 在任務切換過程中起著重要作用,通過它實現任務的掛起和恢復。所謂任務切換是指,掛起當前正在執行的任務,恢復或啟動另一任務的執行。
在任務切換過程中,首先,處理器中各寄存器的當前值被自動保存到 TR(任務寄存器)所指定的任務的 TSS 中;然後,下一任務的 TSS 被裝入 TR;最後,從 TR 所指定的 TSS 中取出各寄存器的值送到處理器的各寄存器中。由此可見,通過在 TSS 中保存任務現場各寄存器狀態的完整映象,實現任務的切換。
因此,__switch_to 核心內容就是將 TSS 中的內核空間(0級)堆棧指針換成 next->esp0。這是因為 CPU 在穿越中斷門或者陷阱門時要根據新的運行級別從TSS中取得進程在系統空間的堆棧指針。
thread_struct.esp0 指向進程的系統空間堆棧的頂端。當一個進程被調度運行時,內核會將這個變數寫入 TSS 的 esp0 欄位,表示這個進程進入0級運行時其堆棧的位置。換句話說,進程的 thread_struct 結構中的 esp0 保存著其系統空間堆棧指針。當進程穿過中斷門、陷阱門或者調用門進入系統空間時,處理器會從這里恢復期系統空間棧。
由於棧中變數的訪問依賴的是段、頁、和 esp、ebp 等這些寄存器,所以當段、頁、寄存器切換完以後,棧中的變數就可以被訪問了。
因此 switch_to 完成了進程堆棧的切換,由於被切進的進程各個寄存器的信息已完成切換,因此 next 進程得以執行指令運行。
由於 A 進程在調用 switch_to 完成了與 B 進程堆棧的切換,也即是寄存器中的值都是 B 的,所以 A 進程在 switch_to 執行完後,A停止運行,B開始運行,當過一段時間又把 A 進程切進去後,A 開始從switch_to 後面的代碼開始執行。
schele 的調用流程如下:
2. linux 如何查看某個進程的用戶和用戶組
"在Linux下查看用戶屬於哪個組有很多種方法,下面介紹常用的方法:
1.使用groups命令,後不加用戶顯示自己屬於哪個組,如果後接用戶名,則顯示這個用戶。
[root@localhost 桌面]# groups
root
[root@localhost 桌面]# groups markzhy
markzhy : markzhy
2.使用id命令,用法同groups命令
[root@localhost 桌面]# id markzhy
uid=1000(markzhy) gid=1000(markzhy) 組=1000(markzhy)
3.直接查看/etc/passwd文件
3. Linux進程的調度
上回書說到 Linux進程的由來 和 Linux進程的創建 ,其實在同一時刻只能支持有限個進程或線程同時運行(這取決於CPU核數量,基本上一個進程對應一個CPU),在一個運行的操作系統上可能運行著很多進程,如果運行的進程占據CPU的時間很長,就有可能導致其他進程餓死。為了解決這種問題,操作系統引入了 進程調度器 來進行進程的切換,輪流讓各個進程使用CPU資源。
1)rq: 進程的運行隊列( runqueue), 每個CPU對應一個 ,包含自旋鎖(spinlock)、進程數量、用於公平調度的CFS信息結構、當前運行的進程描述符等。實際的進程隊列用紅黑樹來維護(通過CFS信息結構來訪問)。
2)cfs_rq: cfs調度的進程運行隊列信息 ,包含紅黑樹的根結點、正在運行的進程指針、用於負載均衡的葉子隊列等。
3)sched_entity: 把需要調度的東西抽象成調度實體 ,調度實體可以是進程、進程組、用戶等。這里包含負載權重值、對應紅黑樹結點、 虛擬運行時vruntime 等。
4)sched_class:把 調度策略(演算法)抽象成調度類 ,包含一組通用的調度操作介面。介面和實現是分離,可以根據調度介面去實現不同的調度演算法,使一個Linux調度程序可以有多個不同的調度策略。
1) 關閉內核搶占 ,初始化部分變數。獲取當前CPU的ID號,並賦值給局部變數CPU, 使rq指向CPU對應的運行隊列 。 標識當前CPU發生任務切換 ,通知RCU更新狀態,如果當前CPU處於rcu_read_lock狀態,當前進程將會放入rnp-> blkd_tasks阻塞隊列,並呈現在rnp-> gp_tasks鏈表中。 關閉本地中斷 ,獲取所要保護的運行隊列的自旋鎖, 為查找可運行進程做准備 。
2) 檢查prev的狀態,更新運行隊列 。如果不是可運行狀態,而且在內核態沒被搶占,應該從運行隊列中 刪除prev進程 。如果是非阻塞掛起信號,而且狀態為TASK_INTER-RUPTIBLE,就把該進程的狀態設置為TASK_RUNNING,並將它 插入到運行隊列 。
3)task_on_rq_queued(prev) 將pre進程插入到運行隊列的隊尾。
4)pick_next_task 選取將要執行的next進程。
5)context_switch(rq, prev, next)進行 進程上下文切換 。
1) 該進程分配的CPU時間片用完。
2) 該進程主動放棄CPU(例如IO操作)。
3) 某一進程搶佔CPU獲得執行機會。
Linux並沒有使用x86 CPU自帶的任務切換機制,需要通過手工的方式實現了切換。
進程創建後在內核的數據結構為task_struct , 該結構中有掩碼屬性cpus_allowed,4個核的CPU可以有4位掩碼,如果CPU開啟超線程,有一個8位掩碼,進程可以運行在掩碼位設置為1的CPU上。
Linux內核API提供了兩個系統調用 ,讓用戶可以修改和查看當前的掩碼:
1) sched_setaffinity():用來修改位掩碼。
2) sched_getaffinity():用來查看當前的位掩碼。
在下次task被喚醒時,select_task_rq_fair根據cpu_allowed里的掩碼來確定將其置於哪個CPU的運行隊列,一個進程在某一時刻只能存在於一個CPU的運行隊列里。
在Nginx中,使用了CPU親和度來完成某些場景的工作:
worker_processes 4;
worker_cpu_affinity 0001001001001000;
上面這個配置說明了4個工作進程中的每一個和一個CPU核掛鉤。如果這個內容寫入Nginx的配置文件中,然後Nginx啟動或者重新載入配置的時候,若worker_process是4,就會啟用4個worker,然後把worker_cpu_affinity後面的4個值當作4個cpu affinity mask,分別調用ngx_setaffinity,然後就把4個worker進程分別綁定到CPU0~3上。
worker_processes 2;
worker_cpu_affinity 01011010;
上面這個配置則說明了兩個工作進程中的每一個和2個核掛鉤。
4. linux中怎麼使後台進程的輸出至控制終端
linux進程組會話控制終端一個進程可以通過fork()調用創建子進程,這些進程就可以構成一個進程組。 進程組--------------------------------------------- 進程組是一個或多個進程的集合。每個進程組有一個稱為組長的進程,組長進程就是其進程號(pid)等於進程組號(gid)的進程(即進程組號等於組長的進程號)。進程組的概念有很多用途,最常見的是我們在終端上向前台執行程序發出終止信號(Ctrl-C),同時終止整個進程組的所有進程。 (1). Shell上的一條命令行形成一個進程組 (2). 每個進程屬於一個進程組 (3). 每個進程組有一個領頭進程(組長) (4). 進程組的生命周期到組中最後一個進程終止, 或加入其他進程組為止 (5). getpgrp: 獲得進程組id, 即領頭進程的pid (6). 前台進程組和後台進程組 (7). 進程A(假設該進程為組長)和其子進程B屬於同一進程組,它們的進程組號(task_struct.gid)都為進程A的進程號(A.pid)會話 --------------------------------------------- 會話期(Session,或者稱為會話)則是一個或多個進程組的集合。通常情況下,用戶登錄後所執行的所有程序都屬於一個會話期,而其登錄shell則是會話期首進程(Session leader),並且它所使用的中斷就是會話期的控制終端(Controlling Terminal),因此會話期的首進程通常也被稱為控制進程(Controlling process)。當我們退出登錄(logout)時,所有屬於這個會話期的進程都將被終止。 (1). 一次登錄形成一個會話 (2). 一個會話可包含多個進程組, 但只能有一個前台進程組. (3). setsid()可建立一個新的會話;如果調用該函數的進程不是進程組的領頭進程, 該函數才能建立新的會話.調用setsid()之後, 調用進程將成為新會話的領頭進程.控制終端--------------------------------------------- (1) 會話的領頭進程打開一個終端之後, 該終端就成為該會話的控制終端 (SVR4/linux) (2) 與控制終端建立連接的會話領頭進程稱為控制進程 (session leader) (3) 一個會話只能有一個控制終端 (4) 產生在控制終端上的輸入和信號將發送給會話的前台進程組中的所有進程 (5) 終端上的連接斷開時(比如網路斷開或Modem斷開), 掛起信號將發送到控制進程(session leader)
5. linux 下查看進程用什麼命令
linux 下查看進程可以使用的命令:
1、ps命令查找與進程相關的PID號:
2、ps a 顯示現行終端機下的所有程序,包括其他用戶的程序。
3、ps -A 顯示所有程序。
4、ps c 列出程序時,顯示每個程序真正的指令名稱,而不包含路徑,參數或常駐服務的標示。
5、ps -e 此參數的效果和指定"A"參數相同。
6、ps e 列出程序時,顯示每個程序所使用的環境變數。
7、ps f 用ASCII字元顯示樹狀結構,表達程序間的相互關系。
8、ps -H 顯示樹狀結構,表示程序間的相互關系。
9、ps -N 顯示所有的程序,除了執行ps指令終端機下的程序之外。
10、ps s 採用程序信號的格式顯示程序狀況。
11、ps S 列出程序時,包括已中斷的子程序資料。
12、ps -t<終端機編號> 指定終端機編號,並列出屬於該終端機的程序的狀況。
13、ps u 以用戶為主的格式來顯示程序狀況。
14、ps x 顯示所有程序,不以終端機來區分。
6. linux後台啟動進程
父子進程
在linux系統裡面,子進程由父進程fork而來,而所有的進程都是由init進程或其子進程fork而來,即init進程是所有進程的祖先。
父子進程的運行是相對獨立的,一方的退出不會導致另一方退出。
進程組和會話
Session特點
session可以在任何時候創建,調用setsid函數即可,session中的第一個進程即為session的leader,leader是不能變的。常見的創建session的場景是用戶登錄,啟動bash進程時將會創建新的session,bash進程會作為session的leader,隨後bash裡面運行的進程(不特殊處理)都將屬於這個session。
session的主要特點是當session的leader退出後,session中的所有其它進程將會收到SIGHUP信號,其默認行為是終止進程,即session的leader退出後,session中的其它進程也會退出。
如果session和tty關聯的話,它們之間只能一一對應,一個tty只能屬於一個session,一個session只能打開一個tty。當然session也可以不和任何tty關聯。
進程的啟動方式:
1)前台啟動:用戶輸入命令,直接執行程序
2)後台啟動:在命令行尾加入「&」符號
要使終端關閉時進程不退出,有以下幾種情況:
1)用戶進程攔截SIGHUP信號。
2)使用戶進程和bash進程不在一個session。
7. 如何正確編寫linux守護進程
1、守護進程,也就是通常說的Daemon進程,是Linux中的後台服務進程。它是一個生存期較長的進程,通常獨立於控制終端並且周期性地執行某種任務或等待處理某些發生的事件。如果想讓某個進程不因為用戶或終端或其他地變化而受到影響,那麼就必須把這個進程變成一個守護進程。
2、創建守護進程步驟
1)創建子進程,父進程退出
之後的所有工作都在子進程中完成,而用戶在Shell終端里則可以執行其他命令,從而在形式上做到了與控制終端的脫離。
在Linux中父進程先於子進程退出會造成子進程成為孤兒進程,而每當系統發現一個孤兒進程時,就會自動由1號進程(init)收養它,這樣,原先的子進程就會變成init進程的子進程。
2)在子進程中創建新會話
進程組:是一個或多個進程的集合。進程組有進程組ID來唯一標識。除了進程號(PID)之外,進程組ID也是一個進程的必備屬性。每個進程組都有一個組長進程,其組長進程的進程號等於進程組ID。且該進程組ID不會因組長進程的退出而受到影響。
會話周期:會話期是一個或多個進程組的集合。通常,一個會話開始於用戶登錄,終止於用戶退出,在此期間該用戶運行的所有進程都屬於這個會話期。
(1)pid_t setsid(void);
setsid() creates a new session if the calling process is not a process group leader. The calling process will be the only process in this new process group and in this new session.
setsid函數用於創建一個新的會話,並擔任該會話組的組長。調用setsid有下面的3個作用:
① 讓進程擺脫原會話的控制
② 讓進程擺脫原進程組的控制
③ 讓進程擺脫原控制終端的控制
有以下三個結果:
(a)成為新會話的首進程
(b)成為一個新進程組的組長進程
(c)沒有控制終端。
有些人建議在此時再次調用fork,並使父進程終止。第二個子進程作為守護進程繼續運行。這樣就保證了該守護進程不是會話首進程。
setsid函數能夠使進程完全獨立出來,從而擺脫其他進程的控制。
setsid()調用成功後,進程成為新的會話組長和新的進程組長,並與原來的登錄會話和進程組脫離。由於會話過程對控制終端的獨占性,進程同時與控制終端脫離。 子進程可以自己組成一個新的進程組,即調用setpgrp()與原進程組脫離關系,產生一個新的進程組,進程組號與它的進程號相同.這樣,父進程退出運行後就不會影響子進程的當前運行.
3)改變當前目錄為根目錄
使用fork創建的子進程繼承了父進程的當前工作目錄;進程活動時,其工作目錄所在的文件系統不能卸下。通常的做法是讓"/"作為守護進程的當前工作目錄,也可以是其他目錄,如/tmp,使用chdir。
4)重設文件許可權掩碼
文件許可權掩碼是指屏蔽掉文件許可權中的對應位。比如,有個文件許可權掩碼是050,它就屏蔽了文件組擁有者的可讀與可執行許可權。mask = mask & ~050
通常,把文件許可權掩碼設置為0,umask(0)。
5)關閉文件描述符
用fork函數新建的子進程會從父進程那裡繼承已經打開了的文件描述符。這些被打開的文件可能永遠不會被守護進程讀寫,但它們一樣消耗系統資源,而且可能導致所在的文件系統無法卸下。
在上面的第二步之後,守護進程已經與所屬的控制終端失去了聯系。因此從終端輸入的字元不可能達到守護進程,守護進程中用常規方法(如printf)輸出的字元也不可能在終端上顯示出來。所以,文件描述符為0、1和2 的3個文件(常說的輸入、輸出和報錯)已經失去了存在的價值,也應被關閉。
for(i=0;i<MAXFILE;i++)
close(i);
6)守護進程退出處理
當用戶需要外部停止守護進程運行時,往往會使用 kill命令停止該守護進程。所以,守護進程中需要編碼來實現kill發出的signal信號處理,達到進程的正常退出。
signal(SIGTERM, sigterm_handler);
void sigterm_handler(int arg)
{
_running = 0;
}
7)處理SIGCHLD信號
處理SIGCHLD信號並不是必須的。但對於某些進程,特別是伺服器進程往往在請求到來時生成子進程處理請求。如果父進程不等待子進程結束,子進程將成為僵屍進程(zombie)從而佔用系統資源。如果父進程等待子進程結束,將增加父進程的負擔,影響伺服器進程的並發性能。在Linux下可以簡單地將 SIGCHLD信號的操作設為SIG_IGN。
signal(SIGCHLD,SIG_IGN);
這樣,內核在子進程結束時不會產生僵屍進程。