云幫手,兼容windows和Linux系統(tǒng),支持多臺云主機(jī),兔費(fèi),可視化面板,實(shí)時查看cpu、內(nèi)存、磁盤使用率、站點(diǎn)等等,還有云主機(jī)一鍵檢測修復(fù)等功能。手動碼字,希望幫到你謝謝。
曾經(jīng)做過幾次大規(guī)模服務(wù)器監(jiān)控,下面推薦幾款監(jiān)控軟件和輔助軟件。
1.zabbix一款老牌經(jīng)典的監(jiān)控軟件。是一個企業(yè)級的分布式開源監(jiān)控方案。能夠?qū)崟r監(jiān)控從成千上萬臺服務(wù)器、虛擬機(jī)和網(wǎng)絡(luò)設(shè)備中收集到的數(shù)以百萬計的指標(biāo)。??
提供圖形操作界面,可以方便的添加監(jiān)控指標(biāo)、告警指標(biāo)。支持郵件、微信等的告警通知。
2.Prometheus,近些年監(jiān)控方面的當(dāng)紅炸子雞??,Prometheus是由SoundCloud開發(fā)的開源監(jiān)控報警系統(tǒng)和時序列數(shù)據(jù)庫(TSDB)。Prometheus使用Go語言開發(fā),是GoogleBorgMon監(jiān)控系統(tǒng)的開源版本。
其優(yōu)點(diǎn)是輕量級,配置簡易,上手簡單,豐富的告警模板。
以上是兩款監(jiān)控軟件,下面推薦幾款監(jiān)控輔助軟件。
1.grafana監(jiān)控展示界面,在我們獲取到監(jiān)控數(shù)據(jù)后,可能需要把數(shù)據(jù)展示出來,給領(lǐng)導(dǎo)們邀功。grafana就是這樣一款軟件,開源免費(fèi),模板豐富。可直接對接zabbixprometheus和mysql數(shù)據(jù)庫等。
2.釘釘機(jī)器人。服務(wù)器出現(xiàn)告警怎么辦,當(dāng)然是發(fā)消息通知運(yùn)維人員啊。釘釘機(jī)器人就提供這么一個功能。在釘釘群里面直接創(chuàng)建機(jī)器人,會給我們一個restfull的接口,我們就可以直接發(fā)送post請求。原生linux就直接用curl發(fā)送,Prometheus提供插件可以直接對接。
我用了云幫手也有一段時間,當(dāng)初只是看重他功能免費(fèi)還有什么一鍵巡檢和修復(fù)功能,不過一段時間用下來,他的監(jiān)控功能我覺得一樣很不錯。
有分別對CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)使用率的具體實(shí)時監(jiān)控,還有總的一個監(jiān)控概況,比較方便了解對服務(wù)器的基本使用狀況。
而且還可以對不同的資源分別設(shè)置不同的告警規(guī)則,一旦超出你的設(shè)定值就會發(fā)送告警信息,大大方便了對服務(wù)器的管理,真心推薦你試一下。
官網(wǎng)地址:https://www.cloudx.cn/download?utm_source=zhan-wukong
云幫手,可視化面板,實(shí)時查看cpu、內(nèi)存、磁盤使用率、站點(diǎn)等等,還有云主機(jī)一鍵檢測修復(fù)等功能。
概述
今天主要對mpstat、iostat、sar、vmstat命令做一下總結(jié),這幾個命令都是屬于運(yùn)維人員必須掌握的,所以,能不偷懶就不偷懶了。
1、mpstat
mpstat是MultiprocessorStatistics的縮寫,是實(shí)時監(jiān)控工具,報告與cpu的一些統(tǒng)計信息這些信息都存在/proc/stat文件中,在多CPU系統(tǒng)里,其不但能查看所有的CPU的平均狀況的信息,而且能夠有查看特定的cpu信息,mpstat最大的特點(diǎn)是:可以查看多核心的cpu中每個計算核心的統(tǒng)計數(shù)據(jù);而且類似工具vmstat只能查看系統(tǒng)的整體cpu情況。
實(shí)例:查看多核cpu當(dāng)前運(yùn)行的狀況,每兩秒更新一次,一共更新5次
#mpstat25
說明:
%user在internal時間段里,用戶態(tài)的CPU時間(%),不包含nice值為負(fù)進(jìn)程(usr/total)*100
%nice在internal時間段里,nice值為負(fù)進(jìn)程的CPU時間(%)(nice/total)*100
%sys在internal時間段里,內(nèi)核時間(%)(system/total)*100
%iowait在internal時間段里,硬盤IO等待時間(%)(iowait/total)*100
%irq在internal時間段里,硬中斷時間(%)(irq/total)*100
%soft在internal時間段里,軟中斷時間(%)(softirq/total)*100
%idle在internal時間段里,CPU除去等待磁盤IO操作外的因?yàn)槿魏卧蚨臻e的時間閑置時間(%)(idle/total)*100
2、iostat
iostat用于輸出CPU和磁盤I/O相關(guān)的統(tǒng)計信息.
語法:
iostat[-c][-d][-h][-N][-k|-m][-t][-V][-x][-z][device[...]|ALL][-p[device[,...]|ALL]][interval[count]]
實(shí)例1:
--參數(shù)-d表示顯示設(shè)備磁盤的使用狀態(tài);-k表示某些使用block為單位的列強(qiáng)制使用kilobytes為單位,2表示數(shù)據(jù)每隔2秒刷新一次6表示一共刷新6次
#iostat-d-k26
說明:
tps:該設(shè)備每秒的傳輸次數(shù)(Indicatethenumberoftransferspersecondthatwereissuedtothedevice.)。
"一次傳輸"意思是"一次I/O請求"。多個邏輯請求可能會被合并為"一次I/O請求"。"一次傳輸"請求的大小是未知的。
kB_read/s:每秒從設(shè)備(driveexpressed)讀取的數(shù)據(jù)量;
kB_wrtn/s:每秒向設(shè)備(driveexpressed)寫入的數(shù)據(jù)量;
kB_read:讀取的總數(shù)據(jù)量;
kB_wrtn:寫入的總數(shù)量數(shù)據(jù)量;這些單位都為Kilobytes。
實(shí)例2:
--可以把K單位換成M
#iostat-d-m26
實(shí)例3:
--使用iostat查看cpu統(tǒng)計信息使用-C參數(shù)
#iostat-c26
實(shí)例4:-X參數(shù)
--iostat還有一個比較常用的-X參數(shù),該選項(xiàng)將用于顯示和io相關(guān)的擴(kuò)展數(shù)據(jù)。
#iostat-d-x-k16
3、sar
sar(SystemActivityReporter系統(tǒng)活動情況報告)是目前Linux上最為全面的系統(tǒng)性能分析工具之一,可以從多方面對系統(tǒng)的活動進(jìn)行報告,包括:文件的讀寫情況、系統(tǒng)調(diào)用的使用情況、磁盤I/O、CPU效率、內(nèi)存使用狀況、進(jìn)程活動及IPC有關(guān)的活動等,sar命令有sysstat安裝包安裝。
語法:
sar[options][<interval>[<count>]]
--Optionsare:
-A:所有報告的總和
-b:顯示I/O和傳遞速率的統(tǒng)計信息
-B:顯示換頁狀態(tài)
-d:輸出每一塊磁盤的使用信息
-e:設(shè)置顯示報告的結(jié)束時間
-f:從制定的文件讀取報告
-i:設(shè)置狀態(tài)信息刷新的間隔時間
-P:報告每個CPU的狀態(tài)
-R:顯示內(nèi)存狀態(tài)
–u:輸出cpu使用情況和統(tǒng)計信息
–v:顯示索引節(jié)點(diǎn)、文件和其他內(nèi)核表的狀態(tài)
-w:顯示交換分區(qū)的狀態(tài)
-x:顯示給定進(jìn)程的裝
-r:報告內(nèi)存利用率的統(tǒng)計信息
實(shí)例1:
--每2秒采樣一次,連續(xù)4次,觀察cpu的使用情況,并將采樣的結(jié)果以二進(jìn)制形式存入當(dāng)前目錄下的文件sar中,如下:
#sar-u-osar24
實(shí)例2:
--從二進(jìn)制中調(diào)取
#sar-u-f/root/sar
實(shí)例3:
--報告每個cpu的狀態(tài),1秒一次,一共4次
#sar-p14
實(shí)例4:
--查看平均負(fù)載
#sar-q
實(shí)例5:
--查看內(nèi)存使用情況
#sar-r
實(shí)例6:
--查看系統(tǒng)swap分區(qū)的統(tǒng)計信息
#sar-w
實(shí)例7:
--磁盤使用統(tǒng)計信息
#sar-d
默認(rèn)監(jiān)控:
sar55//CPU和IOWAIT統(tǒng)計狀態(tài)
(1)sar-b55//IO傳送速率
(2)sar-B55//頁交換速率
(3)sar-c55//進(jìn)程創(chuàng)建的速率
(4)sar-d55//塊設(shè)備的活躍信息
(5)sar-nDEV55//網(wǎng)路設(shè)備的狀態(tài)信息
(6)sar-nSOCK55//SOCK的使用情況
(7)sar-nALL55//所有的網(wǎng)絡(luò)狀態(tài)信息
(8)sar-PALL55//每顆CPU的使用狀態(tài)信息和IOWAIT統(tǒng)計狀態(tài)
(9)sar-q55//隊(duì)列的長度(等待運(yùn)行的進(jìn)程數(shù))和負(fù)載的狀態(tài)
(10)sar-r55//內(nèi)存和swap空間使用情況
(11)sar-R55//內(nèi)存的統(tǒng)計信息(內(nèi)存頁的分配和釋放、系統(tǒng)每秒作為BUFFER使用內(nèi)存頁、每秒被cache到的內(nèi)存頁)
(12)sar-u55//CPU的使用情況和IOWAIT信息(同默認(rèn)監(jiān)控)
(13)sar-v55//inode,fileandotherkerneltablesd的狀態(tài)信息
(14)sar-w55//每秒上下文交換的數(shù)目
(15)sar-W55//SWAP交換的統(tǒng)計信息(監(jiān)控狀態(tài)同iostat的siso)
(16)sar-x290655//顯示指定進(jìn)程(2906)的統(tǒng)計信息,信息包括:進(jìn)程造成的錯誤、用戶級和系統(tǒng)級用戶CPU的占用情況、運(yùn)行在哪顆CPU上
(17)sar-y55//TTY設(shè)備的活動狀態(tài)
(18)將輸出到文件(-o)和讀取記錄信息(-f)
4、vmstat
vmstat命令是最常見的Linux/Unix監(jiān)控工具,可以展現(xiàn)給定時間間隔的服務(wù)器的狀態(tài)值,包括服務(wù)器的CPU使用率,內(nèi)存使用,虛擬內(nèi)存交換情況,IO讀寫情況。這個命令是我查看Linux/Unix最喜愛的命令,一個是Linux/Unix都支持,二是相比top,我可以看到整個機(jī)器的CPU,內(nèi)存,IO的使用情況,而不是單單看到各個進(jìn)程的CPU使用率和內(nèi)存使用率(使用場景不一樣)。
實(shí)例1:
--第一個參數(shù)是采樣的時間間隔數(shù),單位是秒,第二個參數(shù)是采樣的次數(shù)
--如果想在一段時間內(nèi)一直監(jiān)控可執(zhí)行#vmstat2
#vmstat26
說明:
r表示運(yùn)行隊(duì)列(就是說多少個進(jìn)程真的分配到CPU),當(dāng)這個值超過了CPU數(shù)目,就會出現(xiàn)CPU瓶頸了。這個也和top的負(fù)載有關(guān)系,一般負(fù)載超過了3就比較高,超過了5就高
,超過了10就不正常了,服務(wù)器的狀態(tài)很危險。top的負(fù)載類似每秒的運(yùn)行隊(duì)列。如果運(yùn)行隊(duì)列過大,表示你的CPU很繁忙,一般會造成CPU使用率很高。
b表示阻塞的進(jìn)程
swpd虛擬內(nèi)存已使用的大小,如果大于0,表示你的機(jī)器物理內(nèi)存不足了,如果不是程序內(nèi)存泄露的原因,那么你該升級內(nèi)存了或者把耗內(nèi)存的任務(wù)遷移到其他機(jī)器。
free空閑的物理內(nèi)存的大小
buffLinux/Unix系統(tǒng)是用來存儲,目錄里面有什么內(nèi)容,權(quán)限等的緩存
cachecache直接用來記憶我們打開的文件,給文件做緩沖
si每秒從磁盤讀入虛擬內(nèi)存的大小,如果這個值大于0,表示物理內(nèi)存不夠用或者內(nèi)存泄露了,要查找耗內(nèi)存進(jìn)程解決掉。
so每秒虛擬內(nèi)存寫入磁盤的大小,如果這個值大于0,同上
bi塊設(shè)備每秒接收的塊數(shù)量,這里的塊設(shè)備是指系統(tǒng)上所有的磁盤和其他塊設(shè)備,默認(rèn)塊大小是1024byte
bo塊設(shè)備每秒發(fā)送的塊數(shù)量,例如我們讀取文件,bo就要大于0。bi和bo一般都要接近0,不然就是IO過于頻繁,需要調(diào)整。
in每秒CPU的中斷次數(shù),包括時間中斷
cs每秒上下文切換次數(shù)
us用戶CPU時間
sy系統(tǒng)CPU時間,如果太高,表示系統(tǒng)調(diào)用時間長,例如是IO操作頻繁。
id空閑CPU時間
wt等待IOCPU時間。
這種基礎(chǔ)命令一定要會,建議大家熟記,后面會分享更多devops和DBA方面的內(nèi)容,感興趣的朋友可以關(guān)注下~
云幫手是一款監(jiān)控和管理云服務(wù)器的軟件。
1.集多云商,多系統(tǒng),多環(huán)境的云主機(jī)批量管理,
2.支持系統(tǒng)修復(fù),
3.云監(jiān)控資源告警,
4.遠(yuǎn)程連接,處理文件。基本上針對云主機(jī),云幫手的功能是十分齊全的了。
這款可以推薦你試用一下,畢竟一款神器在手,啥都不愁。
云幫手,可以自行下載體驗(yàn)一下:https://www.cloudx.cn/download?utm_source=cai-wukong
云幫手是用來監(jiān)控云主機(jī)資源情況的,而且批量管理,系統(tǒng)修復(fù)等云主機(jī)工具的功能。不是黑客軟件偷偷監(jiān)聽別人服務(wù)器。如果用云幫手來管理云主機(jī),總體功能還是很齊全的,而且這款軟件還是免費(fèi)的。
分享免費(fèi)下載地址https://www.cloudx.cn/?utm_source=wu-wk
搜浪信息科技發(fā)展(上海)有限公司 備案號:滬ICP備17005676號