存儲伺服器常見故障
⑴ 伺服器常見故障處理
伺服器常見故障處理
網路管理員90%的工作往往是診斷和解決各種各樣的故障。為了說明診斷網路故障的一般過程,本文例舉了幾種故障情形,有的是常見的小問題,有的是比較艱巨的挑戰。當你遇到類似的問題時,就可以按照本文例子的介紹,先問自己幾個簡單的問題,逐步隔離問題所在,最後找到真正的問題根源。
故障一、找不到驗證密碼的域伺服器
毫無疑問,你也一定遇到過這樣的情形:當你坐在一台工作站之前准備登錄網路,Windows卻報告說找不到用來驗證密碼的域伺服器。要解決這個故障,首先要確定問題到底出在網路、工作站還是伺服器上。從下面幾個問題開始:
→哪些地方改變了?最近是否改動過網路,而這些改動可能導致當前的.問題?有沒有添加新的伺服器、拆除原有的伺服器、改動過交換機或HUB?有沒有添加或減少域控制器、將成員伺服器提升為DC(域控制器)或者相反?
→其他工作站也存在類似的問題嗎?
→伺服器正在運行嗎?
經過檢查,你發現此前工作站一直順利地運行,其他工作站沒有遇到類似的問題,伺服器也正常。根據故障現象,基本上可以確定故障出在工作站本身。接下來要確定工作站的那個地方出了故障,試試下面幾個問題:
→工作站能夠Ping到伺服器嗎?
→工作站獲得了一個IP地址嗎?
檢測表明,工作站能夠Ping到伺服器,但Ping操作有時超時,這表明工作站和伺服器之間只有斷斷續續的通信。在命令行上執行ipconfig/renew命令,多執行幾次,工作站有時會更新IP地址,有時不會。這是工作站和伺服器之間斷續通信的症狀。
現在將問題工作站的網路連接和另一台工作站的對換一下,新工作站在問題工作站的位置上也不能連接網路,而問題工作站卻能從另一個網路位置順利地連接網路。現在已經很清楚:問題工作站所在位置的電纜或Hub出了問題。
拆下故障位置上網路電纜連接Hub的那一端,將它接到另一個Hub上,故障依舊。現在可以肯定電纜就是引起故障的罪魁禍首了。
故障二、Windows服務不能啟動
在一台Windows2000伺服器上,部分服務設置成不用本地的系統帳戶啟動。一次重新啟動Windows2000伺服器之後,發現這些服務沒有啟動,必須手工打開服務,重新輸入密碼,然後啟動服務。每次重新輸入密碼,都收到消息說:<用戶名字>已被授予作為服務登錄的許可權。
要解決該故障,首先回答下面幾個問題:
→哪些地方改變了?是否有人修改了伺服器?
→這個服務以前能夠啟動嗎?
→用戶名稱和密碼正確嗎?
查詢修改記錄發現,該伺服器是一個DC,不久之前還是域控制器組織單元(OU,OrganizationalUnit)的成員。在移出該OU之前,這些服務一直能夠順利啟動。另外,用來啟動這些服務的用戶名稱和密碼都是合法的。進一步研究發現,域控制器OU的成員有一些特殊的許可權,其中包括作為服務登錄的許可權。當出現問題的伺服器移出該OU時,伺服器失去了那些許可權。現在要做的是恢復伺服器的許可權。
要將許可權授予伺服器,請按照如下步驟操作:
→在管理控制台(MMC)中打開活動目錄用戶和計算機管理單元,再打開域控制器OU的“屬性”對話框。
→在組策略頁中,點擊“默認域控制器策略”,然後點擊“編輯”,打開組策略管理器。
→依次擴展計算機配置/Windows設置/安全設置,再擴展“本地策略”,然後點擊“用戶權利指派”。
→在右邊的窗格中,右擊“作為服務登錄”,選擇菜單“安全”。
→把用來啟動服務的用戶帳戶加入到策略(圖一),完成後點擊“確定”。
;⑵ 伺服器硬體常見故障有哪些
常見伺服器硬體故障排查判斷:
伺服器常見故障的診斷與解決:伺服器故障排除第一部分 伺服器故障排除的基本原則性問題伺服器故障排除一、伺服器開機黑屏故障排查1.檢查供電環境,零-火;零-地電壓?2.檢查電源指示燈,如果亮,正常嗎?3.按下電源開關時,鍵盤上指示燈亮嗎?風扇全部轉動嗎?4.是否更換過顯示器,更換另一台顯示器。5.去掉增加內存6.去掉增加的CPU7.去掉增加的第三方I/O卡8.檢查內存和CPU插的是否牢靠9. Clear CMOS10.更換主要備件,如系統板,內存和CPU伺服器故障排除二、伺服器故障排除的基本原則1.盡量恢復系統預設配置a:硬體配置:去除第三方廠商備件和非標配備件;b:資源配置:清除CMOS,恢復資源初始配置;c: BIOS,F/W,驅動程序:升級最新的BIOS,F/W和相關驅動程序;d: TPL:擴展的第三方的I/O卡屬於該機型的硬體兼容列表(TPL)嗎?2.從基本到復雜a:系統上從個體到網路:首先將存在故障的伺服器獨立運行,待測試正常後再接入網路運行,觀察故障現象變化並處理。b:硬體上從最小系統到現實系統:指從可以運行的硬體開始逐步到現實系統為止。c:軟體上從基本系統到現實系統:指從基本操作系統開始逐步到現實系統為止。3.交換對比a:在最大可能相同的條件下,交換操作簡單效果明顯的部件;b:交換NOS載體,既交換軟體環境;c:交換硬體,既交換硬體環境;d:交換整機,既交換整體環境;伺服器故障排除三、伺服器故障排除需要收集哪些信息?伺服器信息:1.機器型號2.機器序列號(S/N:如:NC00075534)3.Bios版本4.是否增加其它設備,如網卡,SCSI卡,內存,CPU5.硬碟如何配置,是否做陣列,陣列級別6.安裝什麼操作系統及版本(Windows Server, Netware, Sco, others)
⑶ 伺服器使用期間常出現的問題有哪些
一般會出現網路延遲或者數據中斷的情況,這些都是只能降低不可能完全避免的。愷信網路可以為您提供專業的一對一人工售後保障安全。有興趣可以了解一下
⑷ 伺服器一般出現的故障有哪些
主要的故障有,宕機,崩潰,,主要分硬體故障和軟體故障,也分為人為故障和機器故障。發生故障的第一時間找到服務商進行控制,以免造成更多損失。因此,租用伺服器選擇售後服務好的服務商至關重要。——網時服務商
⑸ 常見伺服器故障類型及排查方法總結
四,伺服器故障排查方法總結
問題描述:
每當出現網站訪問不了的時候,估計應該就是服務世帶器出現故障了,這個時候大部分情況都是屬於資料庫出現問題。
查找步驟:
1、查找top檢查伺服器負載是否有問題
一般網站訪問不了,top顯示的負載都是很大的,這個時候可以看到mysql的進程佔用資源很高,往往就是mysql發生故障了
2、在伺服器中查看網站的訪問記錄
這些訪問記錄存儲在:/home/對應的網站名/access-logs/對應的網站名
可以先通過tail查看,查看出異常的ip的時候可以通過grep進行過濾查看,在這個文件一般都可以找到惡意爬蟲、惡意訪問的記錄,這些往往有可能是導致mysql資料庫掛掉的原因。
3、這個時候先對資料庫進行重啟,對apache進行重啟
service mysql restart
service httpd restart
重啟之後一般都可以暫時恢復正常的訪問的了。如果是出於惡意訪問的話,找出惡意訪問的ip把它禁止掉即可,如果是網站資料庫出現故障,那麼還要進行資料庫排查。
4、查者返基找資料庫錯誤日誌
首先需要知道資料庫mysql的安裝目錄,可以通過whereis mysql找到,但是這往往沒用
還有一種方法,就是通過ps -ef | grep mysql來查看
或者也可以通過進入mysql,使用select @@basedir as basePath from al來查看mysql安裝目錄
我們在第二種查找方法ps -ef | grep mysql中對應mysql的幾種日誌找到其所在目錄,然後查看對應文件進行分析
mysql有以下幾種日誌
錯誤日誌:-log-err
查詢日誌:-log
慢查詢日誌:-log-slow-queries
更新日誌:-log-update
二進制日誌:-log-bin
以上便是對應的資料庫錯誤日誌和慢查詢日誌的查看方法了
在伺服器的維修中,線索都會顯得撲朔迷離,有的甚至按起葫蘆翹起瓢。一般來說不可能一次就可以准確地判斷出問題的所在。這樣就要求工程師要有信心和耐心。出現錯誤一般的方法都是首謹根據經驗優先使用最簡單排錯方法測試,如果沒有解決問題再找其它因素進行測試。總之,伺服器出錯後必須一步一步解決,沒有捷徑可言。
⑹ IBM DS3400 某一指示黃燈長亮,按經驗來看,應該是伺服器的時間不對正,但在校正時間的時候發生如下問題:
第一,你給得信息太少了,要想明確是什麼問題需要你點擊「storage subsystem needs attention」項查看當前報錯原因和日誌。
第二,我注意到你的存儲有兩塊hot space盤,並且有一塊的狀態是in-use。如果存儲沒有出問題,並且沒有人工操作,哪這兩塊盤都是為standby狀態的,也就是待命狀態,哪是在什麼情況下變成in-use的呢?存儲里正在運行的array里有個別盤出現故障,哪hot space(熱備盤)會在線自動頂替故障盤,並同步數據,保持數據的完整性。所以由此我推測是不是有一塊盤發生了故障?
故障盤在存儲上可以看到是亮黃燈的。
hot space,並不是必須,有raid5這樣的保護機制就可以保證數據的安全。但是RAID5有發生一塊盤故障時,整個RAID5 array會是降級工作,長時間降級工作會有數據不完整的風險。所以會有hot space,這樣的更用安全的機制。
更換完壞盤,存儲會把數據重新同步到新盤中,而原先的hot space,會還是hot space,in-use的值還0。
如果是有一塊盤壞了,哪在保800報修就可以了,出保讓供貨商幫換也可以。
時間不對無所謂,不至於報錯。修正時間,你連了幾個控制器,如果你只連了一個哪是改不了配置的。控制器間沒有辦法同步。
你還是點一下「storage subsystem needs attention」看看有什麼信息,或者貼出來結果幫你看看。
⑺ 聯想伺服器第一個硬碟三角形感嘆號一直紅色是什麼問題求教
硬碟就好比放置貨物的倉庫,它的安全與否很大程度上決定了貨物的安全。硬碟作為伺服器核心數據存儲的地方,記錄著所有用戶數據和軟體,其重要性可想而知。
伺服器硬碟常見坦帶的故障及原因
硬碟每時每刻都在讀取數據,不間斷的工作使得出現故障的可能性也比較大,而硬碟發生故障的時候,通常會有一系列表現:
一、故障提示
這是最直接的一種故障表現方式,硬碟也具備自我監測的能力,當硬碟中的部件與我們設置的正常范圍值不同時,就會自動發出提示信息。我們就可以根據這個提示信息,進行相應的修復。
二、運行報錯
運行出錯也分為系統運行出錯和硬碟運行出錯。
系統運行出錯表現為運行過程中不吵晌斷出現程序錯誤的提示,掃描磁碟時出現停滯或死機等情況,這個時候首先檢查是否系統安裝問題,如果不是,就能確定為硬碟故障。
硬碟運行出錯表現在掃描時自身出現錯誤,顯示壞道等情況,這個時候表示硬碟部件出現問題,需要將其修復或隔升信鋒離。
三、硬碟無法讀取或識別
啟動伺服器時,硬碟無法正常被讀取,或者被識別後,系統仍然無法顯示硬碟,這就證明硬碟出現錯誤。
四、初始化死機
一旦初始化就出現死機,雖然也有可能是內存、病毒感染等問題,但最可能的還是硬碟故障,出現這種情況時,不妨優先檢查硬碟。(源自:BlueHost中國)
了解更多
⑻ 常見的伺服器故障有哪些
DNS伺服器設置錯誤解決辦法:如果ISP提供商分配給你的是固定的IP地址,那麼請正確填寫ISP提供的IP地址與DNS伺服器地址;如果ISP提供商分配的是動態的IP地址,那麼無須填寫DNS伺服器地址;還有一個可能是ISP提供商的DNS伺服器出錯不能正確地進行域名→IP地址之間的轉換,這個時候你可以在瀏覽器的地址欄敲入網站的IP地址,即可瀏覽網頁。 防火牆設置錯誤 解決辦法:如果防火牆設置不當,那麼可能阻隔與外網進行信息交換,造成無法瀏覽網頁的故障。我們可以修改防火牆設置。什麼,怎麼修改?這就不用俺說了吧。嗯,還是說一下,對於不了解的朋友直接選默認級別,選"中"就可以了。