linux性能工具
❶ linux中哪些工具可以測試cuda程序,監控gpu內存性能
nvcc 編譯代碼
nvcc -o squareSum squareSum.cu運行結果:
CUDA initialized.
(GPU) sum:29909398 time:787124792
(CPU) sum:29909398 time:10000
從執行的結果可以看出, GPU 中運行的程序居然要比 CPU 中的消耗的時鍾周期還要多得多。這是有原因的。
因為程序之中並沒有使用 CUDA 並行執行的優勢。
這里分析一下 GPU 運行的性能。
此 GPU 消耗的時鍾周期: 787124792 cycles
GeForce G 103M 的 clockRate: 1.6 GHz
所以可以計算出 GPU 上運行時間是: 時鍾周期 / clockRate = 0.49195 s
1 M 個 int 型數據有 4M Byte 的數據量,實際使用的 GPU 內存帶寬是:數據量 / 運行時間 = 8.13 MB/s
可見這個程序沒有很好的發揮 GPU 的性能,使用的內存帶寬很小。
沒有有效利用 GPU 性能的原因???
在 CUDA 中,一般的數據復制到的顯卡內存的部份,稱為 global memory。這些內存是沒有 cache 的,而且,存取 global memory 所需要的時間(即 latency)是非常長的,通常是數百個 cycles。
由於我們的程序只有一個 thread,所以每次它讀取 global memory 的內容,就要等到實際讀取到數據、累加到 sum 之後,才能進行下一步。這就是為什麼它的表現會這么的差。實際上 GPU 一直在等待上一個數據運行的結束,然後再拷貝一個內存數據,所以使用的時鍾周期自然就長了。
由於 global memory 沒有 cache,所以要避開巨大的 latency 的方法,就是要利用大量的 threads。假設現在有大量的 threads 在同時執行,那麼當一個 thread 讀取內存,開始等待結果的時候,GPU 就可以立刻切換到下一個 thread,並讀取下一個內存位置。因此,理想上當 thread 的數目夠多的時候,就可以完全把 global memory 的巨大 latency 隱藏起來了。
❷ 如何查看linux的cpu使用率
top命令是Linux下常用的性能分析工具,能夠實時顯示系統中各個進程的資源佔用狀況,類似於Windows的任務管理器
可以直接使用top命令後,查看%MEM的內容。可以選擇按進程查看或者按用戶查看,如想查看oracle用戶的進程內存使用情況的話可以使用如下的命令:
$ top -u oracle
2. 釋義:
PID:進程的ID
USER:進程所有者
PR:進程的優先順序別,越小越優先被執行
NInice:值
VIRT:進程佔用的虛擬內存
RES:進程佔用的物理內存
SHR:進程使用的共享內存
S:進程的狀態。S表示休眠,R表示正在運行,Z表示僵死狀態,N表示該進程優先值為負數
%CPU:進程佔用CPU的使用率
%MEM:進程使用的物理內存和總內存的百分比
TIME+:該進程啟動後佔用的總的CPU時間,即佔用CPU使用時間的累加值。
COMMAND:進程啟動命令名稱
3.操作實例:
在命令行中輸入 逗top地
即可啟動 top
top 的全屏對話模式可分為3部分:系統信息欄、命令輸入欄、進程列表欄。
第一部分 -- 最上部的 系統信息欄 :
第一行(top):
逗00:11:04地為系統當前時刻;
逗3:35地為系統啟動後到現在的運作時間;
逗2 users地為當前登錄到系統的用戶,更確切的說是登錄到用戶的終端數 -- 同一個用戶同一時間對系統多個終端的連接將被視為多個用戶連接到系統,這里的用戶數也將表現為終端的數目;
逗load average地為當前系統負載的平均值,後面的三個值分別為1分鍾前、5分鍾前、15分鍾前進程的平均數,一般的可以認為這個數值超過 CPU 數目時,CPU 將比較吃力的負載當前系統所包含的進程;
第二行(Tasks):
逗59 total地為當前系統進程總數;
逗1 running地為當前運行中的進程數;
逗58 sleeping地為當前處於等待狀態中的進程數;
逗0 stoped地為被停止的系統進程數;
逗0 zombie地為被復原的進程數;
第三行(Cpus):
分別表示了 CPU 當前的使用率;
第四行(Mem):
分別表示了內存總量、當前使用量、空閑內存量、以及緩沖使用中的內存量;
第五行(Swap):
表示類別同第四行(Mem),但此處反映著交換分區(Swap)的使用情況。通常,交換分區(Swap)被頻繁使用的情況,將被視作物理內存不足而造成的。
第二部分 -- 中間部分的內部命令提示欄:
top 運行中可以通過 top 的內部命令對進程的顯示方式進行控制。內部命令如下表:
s
- 改變畫面更新頻率
l - 關閉或開啟第一部分第一行 top 信息的表示
t - 關閉或開啟第一部分第二行 Tasks 和第三行 Cpus 信息的表示
m - 關閉或開啟第一部分第四行 Mem 和 第五行 Swap 信息的表示
N - 以 PID 的大小的順序排列表示進程列表(第三部分後述)
P - 以 CPU 佔用率大小的順序排列進程列表 (第三部分後述)
M - 以內存佔用率大小的順序排列進程列表 (第三部分後述)
h - 顯示幫助
n - 設置在進程列表所顯示進程的數量
q - 退出 top
s -
改變畫面更新周期
第三部分 -- 最下部分的進程列表欄:
以 PID 區分的進程列表將根據所設定的畫面更新時間定期的更新。通過 top 內部命令可以控制此處的顯示方式
pmap
可以根據進程查看進程相關信息佔用的內存情況,(進程號可以通過ps查看)如下所示:
$ pmap -d 5647
ps
如下例所示:
$ ps -e -o 'pid,comm,args,pcpu,rsz,vsz,stime,user,uid' 其中rsz是是實際內存
$ ps -e -o 'pid,comm,args,pcpu,rsz,vsz,stime,user,uid' | grep oracle | sort -nrk
其中rsz為實際內存,上例實現按內存排序,由大到小
在Linux下查看內存我們一般用free命令:
[root@scs-2 tmp]# free
total used free shared buffers cached
Mem: 3266180 3250004 16176 0 110652 2668236
-/+ buffers/cache: 471116 2795064
Swap: 2048276 80160 1968116
下面是對這些數值的解釋:
total:總計物理內存的大小。
used:已使用多大。
free:可用有多少。
Shared:多個進程共享的內存總額。
Buffers/cached:磁碟緩存的大小。
第三行(-/+ buffers/cached):
used:已使用多大。
free:可用有多少。
第四行就不多解釋了。
區別:第二行(mem)的used/free與第三行(-/+ buffers/cache) used/free的區別。 這兩個的區別在於使用的角度來看,第一行是從OS的角度來看,因為對於OS,buffers/cached 都是屬於被使用,所以他的可用內存是16176KB,已用內存是3250004KB,其中包括,內核(OS)使用+Application(X, oracle,etc)使用的+buffers+cached.
第三行所指的是從應用程序角度來看,對於應用程序來說,buffers/cached 是等於可用的,因為buffer/cached是為了提高文件讀取的性能,當應用程序需在用到內存的時候,buffer/cached會很快地被回收。
所以從應用程序的角度來說,可用內存=系統free memory+buffers+cached。
如上例:
2795064=16176+110652+2668236
接下來解釋什麼時候內存會被交換,以及按什麼方交換。 當可用內存少於額定值的時候,就會開會進行交換。
如何看額定值:
cat /proc/meminfo
[root@scs-2 tmp]# cat /proc/meminfo
MemTotal: 3266180 kB
MemFree: 17456 kB
Buffers: 111328 kB
Cached: 2664024 kB
SwapCached: 0 kB
Active: 467236 kB
Inactive: 2644928 kB
HighTotal: 0 kB
HighFree: 0 kB
LowTotal: 3266180 kB
LowFree: 17456 kB
SwapTotal: 2048276 kB
SwapFree: 1968116 kB
Dirty: 8 kB
Writeback: 0 kB
Mapped: 345360 kB
Slab: 112344 kB
Committed_AS: 535292 kB
PageTables: 2340 kB
VmallocTotal: 536870911 kB
VmallocUsed: 272696 kB
VmallocChunk: 536598175 kB
HugePages_Total: 0
HugePages_Free: 0
Hugepagesize: 2048 kB
用free -m查看的結果:
[root@scs-2 tmp]# free -m
total used free shared buffers cached
Mem: 3189 3173 16 0 107 2605
-/+ buffers/cache: 460 2729
Swap: 2000 78 1921
查看/proc/kcore文件的大小(內存鏡像):
[root@scs-2 tmp]# ll -h /proc/kcore
-r-------- 1 root root 4.1G Jun 12 12:04 /proc/kcore
備註:
佔用內存的測量
測量一個進程佔用了多少內存,linux為我們提供了一個很方便的方法,/proc目錄為我們提供了所有的信息,實際上top等工具也通過這里來獲取相應的信息。
/proc/meminfo 機器的內存使用信息
/proc/pid/maps pid為進程號,顯示當前進程所佔用的虛擬地址。
/proc/pid/statm 進程所佔用的內存
[root@localhost ~]# cat /proc/self/statm
654 57 44 0 0 334 0
輸出解釋
CPU 以及CPU0。。。的每行的每個參數意思(以第一行為例)為:
參數 解釋 /proc//status
Size (pages) 任務虛擬地址空間的大小 VmSize/4
Resident(pages) 應用程序正在使用的物理內存的大小 VmRSS/4
Shared(pages) 共享頁數 0
Trs(pages) 程序所擁有的可執行虛擬內存的大小 VmExe/4
Lrs(pages) 被映像到任務的虛擬內存空間的庫的大小 VmLib/4
Drs(pages) 程序數據段和用戶態的棧的大小 (VmData+ VmStk )4
dt(pages) 04
查看機器可用內存
/proc/28248/>free
total used free shared buffers cached
Mem: 1023788 926400 97388 0 134668 503688
-/+ buffers/cache: 288044 735744
Swap: 1959920 89608 1870312
我們通過free命令查看機器空閑內存時,會發現free的值很小。這主要是因為,在linux中有這么一種思想,內存不用白不用,因此它盡可能的cache和buffer一些數據,以方便下次使用。但實際上這些內存也是可以立刻拿來使用的。
所以 空閑內存=free+buffers+cached=total-used
top命令 是Linux下常用的性能 分析工具 ,能夠實時顯示系統 中各個進程的資源佔用狀況,類似於Windows的任務管理 器。下面詳細介紹它的使用方法。
top - 02:53:32 up 16 days, 6:34, 17 users, load average: 0.24, 0.21, 0.24
Tasks: 481 total, 3 running, 474 sleeping, 0 stopped, 4 zombie
Cpu(s): 10.3%us, 1.8%sy, 0.0%ni, 86.6%id, 0.5%wa, 0.2%hi, 0.6%si, 0.0%st
Mem: 4042764k total, 4001096k used, 41668k free, 383536k buffers
Swap: 2104472k total, 7900k used, 2096572k free, 1557040k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
32497 jacky 20 0 669m 222m 31m R 10 5.6 29:27.62 firefox
4788 yiuwing 20 0 257m 18m 13m S 5 0.5 5:42.44 konsole
5657 Liuxiaof 20 0 585m 159m 30m S 4 4.0 5:25.06 firefox
4455 xiefc 20 0 542m 124m 30m R 4 3.1 7:23.03 firefox
6188 Liuxiaof 20 0 191m 17m 13m S 4 0.5 0:01.16 konsole
統計信息區前五行是系統整體的統計信息。第一行是任務隊列信息,同 uptime 命令的執行結果。其內容如下:
01:06:48 當前時間
up 1:22 系統運行 時間,格式為時:分
1 user 當前登錄用戶 數
load average: 0.06, 0.60, 0.48 系統負載 ,即任務隊列的平均長度。
三個數值分別為 1分鍾、5分鍾、15分鍾前到現在的平均值。
第二、三行為進程和CPU的信息。當有多個CPU時,這些內容可能會超過兩行。內容如下:
Tasks: 29 total 進程總數
1 running 正在運行的進程數
28 sleeping 睡眠的進程數
0 stopped 停止的進程數
0 zombie 僵屍進程數
Cpu(s): 0.3% us 用戶空間佔用CPU百分比
1.0% sy 內核 空間佔用CPU百分比
0.0% ni 用戶進程空間內改變過優先順序的進程佔用CPU百分比
98.7% id 空閑CPU百分比
0.0% wa 等待輸入輸出的CPU時間百分比
0.0% hi
0.0% si
最後兩行為內存 信息。內容如下:
Mem: 191272k total 物理內存總量
173656k used 使用的物理內存總量
17616k free 空閑內存總量
22052k buffers 用作內核緩存 的內存量
Swap: 192772k total 交換區總量
0k used 使用的交換區總量
192772k free 空閑交換區總量
123988k cached 緩沖的交換區總量。
內存中的內容被換出到交換區,而後又被換入到內存,但使用過的交換區尚未被覆蓋,
該數值即為這些內容已存在於內存中 的交換區的大小。
相應的內存再次被換出時可不必再對交換區寫入。
進程信息區統計信息區域的下方顯示了各個進程的詳細信息。首先來認識一下各列的含義。
序號 列名 含義
a PID 進程id
b PPID 父進程id
c RUSER Real user name
d UID 進程所有者的用戶id
e USER 進程所有者的用戶名
f GROUP 進程所有者的組名
g TTY 啟動進程的終端名。不是從終端啟動的進程則顯示為 ?
h PR 優先順序
i NI nice值。負值表示高優先順序,正值表示低優先順序
j P 最後使用的CPU,僅在多CPU環境 下有意義
k %CPU 上次更新到現在的CPU時間佔用百分比
l TIME 進程使用的CPU時間總計,單位秒
m TIME+ 進程使用的CPU時間總計,單位1/100秒
n %MEM 進程使用的物理內存 百分比
o VIRT 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
p SWAP 進程使用的虛擬內存中,被換出的大小,單位kb。
q RES 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
r CODE 可執行代碼佔用的物理 內存大小,單位kb
s DATA 可執行代碼以外的部分(數據 段+棧)佔用的物理 內存大小,單位kb
t SHR 共享內存大小,單位kb
u nFLT 頁面錯誤次數
v nDRT 最後一次寫入到現在,被修改過的頁面數。
w S 進程狀態。
D =不可中斷的睡眠狀態
R =運行
S =睡眠
T =跟蹤/停止
Z =僵屍進程
x COMMAND 命令名/命令行
y WCHAN 若該進程在睡眠,則顯示睡眠中的系統函數名
z Flags 任務標志,參考 sched.h
默認情況下僅顯示比較重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。可以通過下面的快捷鍵來更改顯示內容。
更改顯示內容通過 f 鍵可以選擇顯示的內容。按 f 鍵之後會顯示列的列表,按 a-z 即可顯示或隱藏對應的列,最後按回車鍵確定。
按 o 鍵可以改變列的顯示順序。按小寫的 a-z 可以將相應的列向右移動,而大寫的 A-Z 可以將相應的列向左移動。最後按回車鍵確定。
按大寫的 F 或 O 鍵,然後按 a-z 可以將進程按照相應的列進行排序。而大寫的 R 鍵可以將當前的排序倒轉。
==============================
top命令使用過程中,還可以使用一些交互的命令來完成其它參數的功能。這些命令是通過快捷鍵啟動的。
<空格>:立刻刷新。
P:根據CPU使用大小進行排序。
T:根據時間、累計時間排序。
q:退出top命令。
m:切換顯示內存信息。
t:切換顯示進程和CPU狀態信息。
c:切換顯示命令名稱和完整命令行。
M:根據使用內存大小進行排序。
W:將當前設置寫入~/.toprc文件中。這是寫top配置文件的推薦方法。
可以看到,top命令是一個功能十分強大的監控系統的工具,對於系統管理員而言尤其重要。但是,它的缺點是會消耗很多系統資源。
應用實例
使用top命令可以監視指定用戶,預設情況是監視所有用戶的進程。如果想查看指定用戶的情況,在終端中按逗U地鍵,然後輸入用戶名,系統就會切換為指定用戶的進程運行界面。
a.作用
free命令用來顯示內存的使用情況,使用許可權是所有用戶。
b.格式
free [-b-k-m] [-o] [-s delay] [-t] [-V]
c.主要參數
-b -k -m:分別以位元組(KB、MB)為單位顯示內存使用情況。
-s delay:顯示每隔多少秒數來顯示一次內存使用情況。
-t:顯示內存總和列。
-o:不顯示緩沖區調節列。
d.應用實例
free命令是用來查看內存使用情況的主要命令。和top命令相比,它的優點是使用簡單,並且只佔用很少的系統資源。通過-S參數可以使用free命令不間斷地監視有多少內存在使用,這樣可以把它當作一個方便實時監控器。
#free -b -s5
使用這個命令後終端會連續不斷地報告內存使用情況(以位元組為單位),每5秒更新一次。
❸ 如何基準測試Linux PC的性能
基準測試是一項測試或一系列測試,用來確定某個計算機硬體運行起來的狀況有多好。在許多情況下,「基準測試」實際上等同於「壓力測試」。通過測試硬體的極限,然後可以將測得的結果與其他硬體測得的結果作一番比較。
大多數基準測試旨在模擬 PC 在實際情形下遇到的那種工作負載。正因為如此,基準測試幾乎就是獲得定量數據、了解系統性能如何的唯一方法――如果你的數據差強人意,這表明應該升級部分PC部件。
所以,准備好測試你自己的 PC 了嗎?下面是可供 Linux 用戶使用的一些比較實用的基準測試。
一、一體化基準測試
一體化基準測試工具又叫基準測試套件,恰如其名:它們測試和衡量系統的各個方面,而不是專注於某一個特定的硬體,如果你不想用三四個不同的工具搞亂系統,這很有用。
1、Phoronix 測試套件
Phoronix 測試套件是最知名的一體化 Linux 基準測試解決方案之一。有一些人聲稱,它有許多固有的問題;當然,我們不會說它在各方面完美無缺,但是它對大多數用戶來說足夠好。另外,外面值得一用的替代套件並不多。
Phoronix 可使用 100 多個不同的測試套件(即一組組單項測試)和 450 多個不同的測試配置文件。你可以選擇只安裝所需的那部分,所以如果你只關注處理器和普通硬碟基準測試,那麼只要安裝「Processor_Tests」和「Disk_Tests」。它還支持系統日誌和報告。
最棒的是,Phoronix 是自由而開源的。它還提供 Live CD 這種形式,名為 PTS Desktop Live,讓你可以直接從 CD、DVD 或 U 盤來運行,所以你可以在需要時使用「干凈」的操作系統,測試任何機器的硬體。
2、Stress-ng
你可能從名稱中猜得,stress-ng 是真正的壓力測試――它極其適合測試系統的極限,但是由於它要求很嚴苛,我們不建議經常運行它。如果反復接受壓力測試,某些部件(尤其是處理器和普通硬碟)會損耗得更快。
將 stress-ng 安裝到 Debian 和 Ubuntu 上:
sudo apt-get install stress-ng
將 stress-ng 安裝到 Fedora、Red Hat 和 CentOS 上:
sudo yum install stress-ng
一旦安裝完畢,stress-ng 可以測試各種各樣的部件,包括處理器、內存、輸入/輸出、 網路、虛擬內存及更多部件。它還很容易配置――針對每項測試,你可以指定不同的參數,比如多少測試實例、多少個處理器核心、測試強度多大、運行多久等。
介紹所有不同的命令和參數不在本文的范圍之內,但是 Ubuntu 維基上的這個頁面是個不錯的起始點。
3、PassMark BurnInTest
PassMark 擁有各種各樣的 PC 測試和監控軟體,包括大名鼎鼎的 MemTest86 和 PerformanceTest 應用程序,它們只面向Windows 用戶。另一方面,BurnInTest 應用程序卻有 Linux 版本,它無疑值得嘗試一番。
簡而言之,它能同時測試計算機的所有主要子系統。但它不是測試純粹的性能,而是更加專注於穩定性和可靠性。為了獲得最佳結果,我們推薦將它與其他一些形式的性能測試手段結合起來。
它提供免費 30 天試用的服務;一旦試用期結束,就要收費(79 美元)。
二、處理器基準測試
比較兩個不同的處理器很困難。還記得你知道奔騰 III 幾乎總是勝過奔騰 II 的日子嗎?有時候,i5 的性能勝過 i7,四核並非總是勝過雙核。
正由於如此,處理器可以從基準測試比較得到最大的好處――超過其他任何一個 PC 硬體。如果你決定不使用上述一體化測試,那麼可以從下面兩款工具中的一款入手。
1、Geekbench
Geekbench 是目前市面上最出色的處理器基準測試之一。它隨帶 10 項整數工作負載測試和 8 項浮點工作負載測試――其中一些測試在 Hardinfo(下有介紹)中也有,但是其中一些是 Geekbench 特有的。
Windows 版本和 Mac 版本隨帶用戶界面,但 Linux 版本只有命令行可執行文件。基準測試結果上傳到網上,讓你可以以一種比終端更直觀的方式查看分數。
上傳後,Geekbench 會在功能有限的「嘗試模式」(實際上是無限制的免費試用)下運行,只有 64 位和 OpenCL 基準測試。想要 CUDA 基準測試、獨立模式及其他功能,你需要購買 Geekbench 或 Geekbench 專業版。
2、Hardinfo
可以使用原生軟體包管理器從大多數發行版獲取 Hardinfo,不過我覺得在 Deiban 和 Ubuntu 上運行這個命令來得更容易:
sudo apt-get install hardinfo
或者在 Fedora、Red Hat 和 CentOS 上運行這個命令:
sudo yum install hardinfo
Hardinfo 隨帶 6 項不同的基準測試,每一種測試提供了一個分數,你可以用分數來准確地與其他系統比較。處理器測試執行整數運算,FPU 測試執行浮點運算。比較結果時,確保比較的是同樣的測試。
Hardinfo 還是一種迅速獲取系統信息的有用方式。只要瀏覽側邊欄中的各個頁面,即可查看計算機配置的詳細信息。
三、GPU 基準測試
想以一種非科學的方式測試系統的圖形功能,只要看看你的 PC 能不能處理圖形密集型游戲。想獲得更准確的結果,只要運行下列這些測試。
1、Unigine
Unigine 有兩項基準測試值得一提:Valley 基準測試和 Heaven 基準測試。每一項測試渲染不同的場景(分別是覆以森林的山谷和一系列浮空島),迫使你的 GPU「超時工作」。
這是大多數 Linux 游戲玩家首選的圖形基準測試。
免費基準測試是互動式,完全足以大致了解你的 GPU 有多好,但是如果是商業用途、進行深入的逐幀分析,專業版必不可少。售價 495 美元。
2、GFXBench
GFXBench 之前名為 GLBenchmark,它是面向 Linux 系統的兩種主要的圖形基準測試中名氣較小的。它隨帶兩組測試:高級測試(總體性能)和低級測試(特定功能的性能)。
四、數據硬碟基準測試
說到存儲數據的硬碟,速度並非總是最重要。比如說,當硬碟用來存儲備份內容,主要的問題是壽命、可靠性和容量。不過若是日常操作,你需要性能出色的高速固態硬碟。
1、Hdparm
Hdparm 是一種命令行實用工具,安裝在大多數現代的發行版上,非常易於使用。它不僅可用來測試驅動器的性能,還可以針對每個驅動器來改變設置(比如開啟或關閉 DMA)。不過要小心:如果使用不當,Hdparm 會導致驅動器崩潰或損壞!
首先,使用 df 命令列出系統上的所有驅動器。找到想要測試的那個驅動器――如果你沒有把握,可以使用上下文,比如總的磁碟空間或掛載位置,然後與下列命令結合使用。以本文為例,我的驅動器是 /dev/sda2。
為了測試緩沖讀取性能:
sudo hdparm -t /dev/sda2
/dev/sda2:
Timing buffered disk reads: 180 MB in 3.00 seconds = 59.96 MB/sec`
為了測試緩存讀取性能:
sudo hdparm -T /dev/sda2
/dev/sda2:
Timing cached reads: 3364 MB in 2.00 seconds = 1682.75 MB/sec`
無論你使用哪一個,都要多次運行命令,以獲得多個讀數,然後求平均值,以便更准確地了解性能。確保你沒有做可能影響讀數的其他任何操作,比如傳輸文件。
2、Bonnie++
Bonnie++ 是一種自由的實用工具,旨在基準測試文件系統和硬驅性能。它並不直接安裝在大多數發行版上,但是應該出現在核心代碼庫中。可使用下列命令安裝到 Debian 和 Ubuntu上:
sudo apt-get install bonnie++
或者使用這個命令安裝到Fedora、Red Hat或CentOS上:
sudo yum install bonnie++
一旦安裝完畢,運行Bonnie++的最簡單方法就是使用下列命令:
bonnie++ -d /tmp -r 2048 -u [username]
這會在 /tmp 目錄下運行測試(因而測試 /tmp 所在的驅動器的性能),使用的參數表明系統有 2048MB 內存,測試將以[用戶名]的用戶許可權來運行,本文中該用戶是 jleeso。
不確信你的系統上有多少內存?請使用 free –m 命令,在合計欄下查找 Mem。
最後,你會看到逗號分隔的一行,上面是密密麻麻的不同數字。這些就是你的結果。比例:
1.96,1.96,ubuntu,1,1378913658,4G,,786,99,17094,3,15431,3,4662,91,37881,4,548.4,17,16,,,,,142,0,+++++,+++,+++++,+++,+++++,+++,+++++,+++,+++++,+++,16569us,15704ms,2485ms,51815us,491ms,261ms,291us,400us,710us,382us,42us,787us
拷貝它,輸入下面這個命令:
echo "[粘貼你的結果]" | bon_csv2html > /tmp/t
❹ Linux系統下常用性能分析工具top命令,怎麼詳解
top命令是Linux下常用的性能分析工具,能夠實時顯示系統中各個進程的資源佔用狀況,類似於Windows的任務管理器。下面詳細介紹它的使用方法。
top - 01:06:48 up 1:22, 1 user, load average: 0.06, 0.60, 0.48
Tasks: 29 total, 1 running, 28 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.3% us, 1.0% sy, 0.0% ni, 98.7% id, 0.0% wa, 0.0% hi, 0.0% si
Mem: 191272k total, 173656k used, 17616k free, 22052k buffers
Swap: 192772k total, 0k used, 192772k free, 123988k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1379 root 16 0 7976 2456 1980 S 0.7 1.3 0:11.03 sshd
14704 root 16 0 2128 980 796 R 0.7 0.5 0:02.72 top
1 root 16 0 1992 632 544 S 0.0 0.3 0:00.90 init
2 root 34 19 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/0
3 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/0
統計信息區前五行是系統整體的統計信息。第一行是任務隊列信息,同 uptime 命令的執行結果。其內容如下:
01:06:48 當前時間
up 1:22 系統運行時間,格式為時:分
1 user 當前登錄用戶數
load average: 0.06, 0.60, 0.48 系統負載,即任務隊列的平均長度。
三個數值分別為 1分鍾、5分鍾、15分鍾前到現在的平均值。
第二、三行為進程和CPU的信息。當有多個CPU時,這些內容可能會超過兩行。內容如下:
Tasks: 29 total 進程總數
1 running 正在運行的進程數
28 sleeping 睡眠的進程數
0 stopped 停止的進程數
0 zombie 僵屍進程數
Cpu(s): 0.3% us 用戶空間佔用CPU百分比
1.0% sy 內核空間佔用CPU百分比
0.0% ni 用戶進程空間內改變過優先順序的進程佔用CPU百分比
98.7% id 空閑CPU百分比
0.0% wa 等待輸入輸出的CPU時間百分比
0.0% hi
0.0% si
最後兩行為內存信息。內容如下:
Mem: 191272k total 物理內存總量
173656k used 使用的物理內存總量
17616k free 空閑內存總量
22052k buffers 用作內核緩存的內存量
Swap: 192772k total 交換區總量
0k used 使用的交換區總量
192772k free 空閑交換區總量
123988k cached 緩沖的交換區總量。
內存中的內容被換出到交換區,而後又被換入到內存,但使用過的交換區尚未被覆蓋,
該數值即為這些內容已存在於內存中的交換區的大小。
相應的內存再次被換出時可不必再對交換區寫入。
進程信息區統計信息區域的下方顯示了各個進程的詳細信息。首先來認識一下各列的含義。
序號 列名 含義
a PID 進程id
b PPID 父進程id
c RUSER Real user name
d UID 進程所有者的用戶id
e USER 進程所有者的用戶名
f GROUP 進程所有者的組名
g TTY 啟動進程的終端名。不是從終端啟動的進程則顯示為 ?
h PR 優先順序
i NI nice值。負值表示高優先順序,正值表示低優先順序
j P 最後使用的CPU,僅在多CPU環境下有意義
k %CPU 上次更新到現在的CPU時間佔用百分比
l TIME 進程使用的CPU時間總計,單位秒
m TIME+ 進程使用的CPU時間總計,單位1/100秒
n %MEM 進程使用的物理內存百分比
o VIRT 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
p SWAP 進程使用的虛擬內存中,被換出的大小,單位kb。
q RES 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
r CODE 可執行代碼佔用的物理內存大小,單位kb
s DATA 可執行代碼以外的部分(數據段+棧)佔用的物理內存大小,單位kb
t SHR 共享內存大小,單位kb
u nFLT 頁面錯誤次數
v nDRT 最後一次寫入到現在,被修改過的頁面數。
w S 進程狀態。
D=不可中斷的睡眠狀態
R=運行
S=睡眠
T=跟蹤/停止
Z=僵屍進程
x COMMAND 命令名/命令行
y WCHAN 若該進程在睡眠,則顯示睡眠中的系統函數名
z Flags 任務標志,參考 sched.h
默認情況下僅顯示比較重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。可以通過下面的快捷鍵來更改顯示內容。
更改顯示內容通過 f 鍵可以選擇顯示的內容。按 f 鍵之後會顯示列的列表,按 a-z 即可顯示或隱藏對應的列,最後按回車鍵確定。
按 o 鍵可以改變列的顯示順序。按小寫的 a-z 可以將相應的列向右移動,而大寫的 A-Z 可以將相應的列向左移動。最後按回車鍵確定。
按大寫的 F 或 O 鍵,然後按 a-z 可以將進程按照相應的列進行排序。而大寫的 R 鍵可以將當前的排序倒轉。
命令使用
1. 工具(命令)名稱
top
2.工具(命令)作用
顯示系統當前的進程和其他狀況; top是一個動態顯示過程,即可以通過用戶按鍵來不斷刷新當前狀態.如果在前台執行該命令,它將獨占前台,直到用戶終止該程序為止. 比較准確的說,top命令提供了實時的對系統處理器的狀態監視.它將顯示系統中CPU最「敏感」的任務列表.該命令可以按CPU使用.內存使用和執行時間對任務進行排序;而且該命令的很多特性都可以通過互動式命令或者在個人定製文件中進行設定.
3.環境設置
在Linux下使用。
4.使用方法
4.1使用格式
top [-] [d]
[q] [c] [C] [S] [s] [n]
4.2參數說明
d 指定每兩次屏幕信息刷新之間的時間間隔。當然用戶可以使用s交互命令來改變之。
p 通過指定監控進程ID來僅僅監控某個進程的狀態。
q該選項將使top沒有任何延遲的進行刷新。如果調用程序有超級用戶許可權,那麼top將以盡可能高的優先順序運行。
S 指定累計模式
s 使top命令在安全模式中運行。這將去除交互命令所帶來的潛在危險。
i 使top不顯示任何閑置或者僵死進程。
c 顯示整個命令行而不只是顯示命令名
4.3其他
下面介紹在top命令執行過程中可以使用的一些交互命令。從使用角度來看,熟練的掌握這些命令比掌握選項還重要一些。這些命令都是單字母的,如果在命令行選項中使用了s選項,則可能其中一些命令會被屏蔽掉。
Ctrl+L 擦除並且重寫屏幕。
h或者? 顯示幫助畫面,給出一些簡短的命令總結說明。
k 終止一個進程。系統將提示用戶輸入需要終止的進程PID,以及需要發送給該進程什麼樣的信號。一般的終止進程可以使用15信號;如果不能正常結束那就使用信號9強制結束該進程。默認值是信號15。在安全模式中此命令被屏蔽。
i 忽略閑置和僵死進程。這是一個開關式命令。
q 退出程序。
r 重新安排一個進程的優先順序別。系統提示用戶輸入需要改變的進程PID以及需要設置的進程優先順序值。輸入一個正值將使優先順序降低,反之則可以使該進程擁有更高的優先權。默認值是10。
S 切換到累計模式。
s 改變兩次刷新之間的延遲時間。系統將提示用戶輸入新的時間,單位為s。如果有小數,就換算成m s。輸入0值則系統將不斷刷新,默認值是5 s。需要注意的是如果設置太小的時間,很可能會引起不斷刷新,從而根本來不及看清顯示的情況,而且系統負載也會大大增加。
f或者F 從當前顯示中添加或者刪除項目。
o或者O 改變顯示項目的順序。
l 切換顯示平均負載和啟動時間信息。
m 切換顯示內存信息。
t 切換顯示進程和CPU狀態信息。
c 切換顯示命令名稱和完整命令行。
M 根據駐留內存大小進行排序。
P 根據CPU使用百分比大小進行排序。
T 根據時間/累計時間進行排序。
W 將當前設置寫入~/.toprc文件中。這是寫top配置文件的推薦方法
❺ linux性能工具top怎麼查看所有的進程情況默認的只顯示一屏,怎麼翻到一下頁來查看其他進程
top只是顯示最前面的幾個,並不能顯示全部進程
要顯示全部進程用ps -A
❻ 如何使用Nmon監控Linux系統性能
用Nmon監控Linux系統性能的方法請參見下面介紹(配圖):
1、安裝Nmon
2、一旦安裝完成,則可以通過在終端執行nmon命令啟動它。
Nmon命令執行之後,大家可以看到如下輸出:
以上是基礎使用方法。下面再補充一些命令和方法:
1、啟動
打開nmon所在的目錄:cd/usr/local/nmon
修改啟動文件的訪問許可權:chmod755nmon_x86_rhel52
啟動nmon:./nmon_x86_rhel52
如果要采樣nmon的數據保存成文件,可以
./nmon_x86_rhel52-fT-s30-c120
其中30表示每隔30秒nmon取一次系統性能數據,120表示取120次;
這樣nmon將會在運行開始算起連續取得30sX120=60分鍾,可根據實際需要時間調整;當運行以上命令後該目錄下會生成一個.nmon文件,該文件會根據間隔時間被寫入性能數據,當一段時間後再查看該文件,文件位元組變大
利用nmonanalyser分析.nmon文件
當測試結束的同時ftp到伺服器上將.nmon文件get下來,
打開nmon_analyser.zip包下的nmonanalyserv338.xls文件,點擊Analysenomndata按鈕,選擇之前get來下的.nmon文件。
(如果報告以下宏的安全級別太高錯誤,則在「工具--宏--安全性」里把級別調低,然後重新打開nmonanalyserv338.xls文件)
待分析結束後會生成性能分析結果文件(文件格式為.xls,其中包括CPU,IO,內存等性能分析報告)。
分析結果中有很多數據和圖形,簡要介紹主要的性能參數圖像
4.1系統匯總(對應excel標簽的『SYS_SUMM』)
藍線為cpu佔有率變化情況;
粉線為磁碟IO的變化情況;
4.2磁碟讀寫情況匯總(對應excel標簽的『DISK_SUMM』)
藍色為磁碟讀的速率KB/sec
紫色為磁碟寫的速率KB/sec
4.3內存情況匯總(對應excel標簽的『MEM』)
曲線表示內存剩餘量(MB)
分析數據得到的報告文件(.xls)中包含很多性能分析結果數據,根據自己的需要查看。
2、nmon運行本身就消耗系統資源的;
另外如果取到.nmon文件後確定不再需要nmon繼續收集信息則應kill掉nmon;
命令:
ps-A|grepnmon#得到pid
kill-9pid
suse10enterprisesp2:
nmon_x86_rhel3
使用對應的操作系統文件:
chmod+xnmon_x86_ubuntu810
mvnmon_x86_ubuntu810/usr/local/bin/nmon
對於Debian還要做以下操作(不做也同樣能運行):
apt-getinstalllsb-release
lsb_release-d|sed's/Description: //'>/etc/debian_release
然後直接運行nmon即可。
採集數據並生成報表:
採集數據:
nmon-s10-c60-f-m/home/
參數解釋:
-s10每10秒採集一次數據。
-c60採集60次,即為採集十分鍾的數據。
-f生成的數據文件名中包含文件創建的時間。
-m生成的數據文件的存放目錄。
這樣就會生成一個nmon文件,並每十秒更新一次,直到十分鍾後。
生成的文件名如:hostname_090824_1306.nmon,"hostname"是這台主機的主機名。
生成報表:
下載nmonanalyser(生成性能報告的免費工具):
http://www.ibm.com/developerworks/wikis/display/Wikiptype/nmonanalyser
把之前生成的nmon數據文件傳到Windows機器上,用Excel打開分析工具nmonanalyserv33C.xls。點擊Excel文件中的"Analyzenmondata"按鈕,選擇nmon數據文件,這樣就會生成一個分析後的結果文件:hostname_090824_1306.nmon.xls,用Excel打開生成的文件就可以看到結果了。
如果宏不能運行,需要做以下操作:
工具->宏->安全性->中,然後再打開文件並允許運行宏。
自動按天採集數據:
在crontab中增加一條記錄:
00***rootnmon-s300-c288-f-m/home/>/dev/null2>&1
300*288=86400秒,正好是一天的數據。
采樣文件越來越大:
[email protected].***:~/nmon#./nmon-s1-c33-f
[email protected].***:~/nmon#
[email protected].***:~/nmon#-sh*
8.0KAD39_***_sles10_101207_1046.nmon
160Knmon
[email protected].***:~/nmon#-sh*
12KAD39_***_sles10_101207_1046.nmon
160Knmon
[email protected].***:~/nmon#-sh*
16KAD39_***_sles10_101207_1046.nmon
160Knmon
[email protected].***:~/nmon#-sh*
20KAD39_***_sles10_101207_1046.nmon
160Knmon
[email protected].***:~/nmon#-sh*
20KAD39_***_sles10_101207_1046.nmon
160Knmon
註:以上一些機器名稱或系統名稱,請根據實際情況自行調整及修改。
❼ linux 性能優化-- cpu 切換以及cpu過高
本文先介紹了cpu上下文切換的基礎知識,以及上下文切換的類型(進程,線程等切換)。然後介紹了如何查看cpu切換次數的工具和指標的解釋。同時對日常分析種cpu過高的情況下如何分析和定位的方法做了一定的介紹,使用一個簡單的案例進行分析,先用top,pidstat等工具找出佔用過高的進程id,然後通過分析到底是用戶態cpu過高,還是內核態cpu過高,並用perf 定位到具體的調用函數。(來自極客時間課程學習筆記)
1、多任務競爭CPU,cpu變換任務的時候進行CPU上下文切換(context switch)。CPU執行任務有4種方式:進程、線程、或者硬體通過觸發信號導致中斷的調用。
2、當切換任務的時候,需要記錄任務當前的狀態和獲取下一任務的信息和地址(指針),這就是上下文的內容。因此,上下文是指某一時間點CPU寄存器(CPU register)和程序計數器(PC)的內容, 廣義上還包括內存中進程的虛擬地址映射信息.
3、上下文切換的過程:
4、根據任務的執行形式,相應的下上文切換,有進程上下文切換、線程上下文切換、以及中斷上下文切換三類。
5、進程和線程的區別:
進程是資源分配和執行的基本單位;線程是任務調度和運行的基本單位。線程沒有資源,進程給指針提供虛擬內存、棧、變數等共享資源,而線程可以共享進程的資源。
6、進程上下文切換:是指從一個進程切換到另一個進程。
(1)進程運行態為內核運行態和進程運行態。內核空間態資源包括內核的堆棧、寄存器等;用戶空間態資源包括虛擬內存、棧、變數、正文、數據等
(2)系統調用(軟中斷)在內核態完成的,需要進行2次CPU上下文切換(用戶空間-->內核空間-->用戶空間),不涉及用戶態資源,也不會切換進程。
(3)進程是由內核來管理和調度的,進程的切換只能發生在內核態。所以,進程的上下文不僅包括了用戶空間的資源,也包括內核空間資源。
(4)進程的上下文切換過程:
(5)、下列將會觸發進程上下文切換的場景:
7、線程上下文切換:
8、中斷上下文切換
快速響應硬體的事件,中斷處理會打斷進程的正常調度和執行。同一CPU內,硬體中斷優先順序高於進程。切換過程類似於系統調用的時候,不涉及到用戶運行態資源。但大量的中斷上下文切換同樣可能引發性能問題。
重點關注信息:
系統的就緒隊列過長,也就是正在運行和等待 CPU 的進程數過多,導致了大量的上下文切換,而上下文切換又導致了系統 CPU 的佔用率升高。
這個結果中有兩列內容是我們的重點關注對象。一個是 cswch ,表示每秒自願上下文切換(voluntary context switches)的次數,另一個則是 nvcswch ,表示每秒非自願上下文切換(non voluntary context switches)的次數。
linux的中斷使用情況可以從 /proc/interrupts 這個只讀文件中讀取。/proc 實際上是 Linux 的一個虛擬文件系統,用於內核空間與用戶空間之間的通信。/proc/interrupts 就是這種通信機制的一部分,提供了一個只讀的中斷使用情況。
重調度中斷(RES),這個中斷類型表示,喚醒空閑狀態的 CPU 來調度新的任務運行。這是多處理器系統(SMP)中,調度器用來分散任務到不同 CPU 的機制,通常也被稱為處理器間中斷(Inter-Processor Interrupts,IPI)。
這個數值其實取決於系統本身的 CPU 性能。如果系統的上下文切換次數比較穩定,那麼從數百到一萬以內,都應該算是正常的。但當上下文切換次數超過一萬次,或者切換次數出現數量級的增長時,就很可能已經出現了性能問題。這時,需要根據上下文切換的類型,再做具體分析。
比方說:
首先通過uptime查看系統負載,然後使用mpstat結合pidstat來初步判斷到底是cpu計算量大還是進程爭搶過大或者是io過多,接著使用vmstat分析切換次數,以及切換類型,來進一步判斷到底是io過多導致問題還是進程爭搶激烈導致問題。
CPU 使用率相關的重要指標:
性能分析工具給出的都是間隔一段時間的平均 CPU 使用率,所以要注意間隔時間的設置,特別是用多個工具對比分析時,你一定要保證它們用的是相同的間隔時間。比如,對比一下 top 和 ps 這兩個工具報告的 CPU 使用率,默認的結果很可能不一樣,因為 top 默認使用 3 秒時間間隔,而 ps 使用的卻是進程的整個生命周期。
top 和 ps 是最常用的性能分析工具:
這個輸出結果中,第三行 %Cpu 就是系統的 CPU 使用率,top 默認顯示的是所有 CPU 的平均值,這個時候你只需要按下數字 1 ,就可以切換到每個 CPU 的使用率了。繼續往下看,空白行之後是進程的實時信息,每個進程都有一個 %CPU 列,表示進程的 CPU 使用率。它是用戶態和內核態 CPU 使用率的總和,包括進程用戶空間使用的 CPU、通過系統調用執行的內核空間 CPU 、以及在就緒隊列等待運行的 CPU。在虛擬化環境中,它還包括了運行虛擬機佔用的 CPU。
預先安裝 stress 和 sysstat 包,如 apt install stress sysstat。
stress 是一個 Linux 系統壓力測試工具,這里我們用作異常進程模擬平均負載升高的場景。而 sysstat 包含了常用的 Linux 性能工具,用來監控和分析系統的性能。我們的案例會用到這個包的兩個命令 mpstat 和 pidstat。
下面的 pidstat 命令,就間隔 1 秒展示了進程的 5 組 CPU 使用率,
包括:
perf 是 Linux 2.6.31 以後內置的性能分析工具。它以性能事件采樣為基礎,不僅可以分析系統的各種事件和內核性能,還可以用來分析指定應用程序的性能問題。
第一種常見用法是 perf top,類似於 top,它能夠實時顯示佔用 CPU 時鍾最多的函數或者指令,因此可以用來查找熱點函數,使用界面如下所示:
輸出結果中,第一行包含三個數據,分別是采樣數(Samples)如2K、事件類型(event)如cpu-clock:pppH和事件總數量(Event count)如:371909314。
第二種常見用法,也就是 perf record 和 perf report。 perf top 雖然實時展示了系統的性能信息,但它的缺點是並不保存數據,也就無法用於離線或者後續的分析。而 perf record 則提供了保存數據的功能,保存後的數據,需要你用 perf report 解析展示。
1.啟動docker 運行進程:
2.ab工具測試伺服器性能
ab(apache bench)是一個常用的 HTTP 服務性能測試工具,這里用來模擬 Ngnix 的客戶端。
3.分析過程
CPU 使用率是最直觀和最常用的系統性能指標,在排查性能問題時,通常會關注的第一個指標。所以更要熟悉它的含義,尤其要弄清楚:
這幾種不同 CPU 的使用率。比如說:
碰到 CPU 使用率升高的問題,你可以藉助 top、pidstat 等工具,確認引發 CPU 性能問題的來源;再使用 perf 等工具,排查出引起性能問題的具體函數.
❽ Linux裡面top和free -h命令區別是什麼
top命令是Linux下常用的性能分析工具,能夠實時顯示系統中各個進程的資源佔用狀況,常用於服務端性能分析。
free 命令能夠顯示系統中物理上的空閑和已用內存,還有交換內存,同時,也能顯示被內核使用的緩沖和緩存。這些信息是通過解析文件 /proc/meminfo 而收集到的。具體可以看《Linux就該這么學》
top有點類似windows裡面的任務管理器,所有信息都有。Free就只有內存的信息