伺服器故障如何排除
❶ 如何排除Web伺服器出現的故障
伴隨著對信息化要求的不斷提升,相信多數單位都會架設自己的Web伺服器,來在Internet網路中發布信息、宣傳自我。為了保證任何一位上網用戶都能順暢地訪問到Web伺服器中的內容,網路管理員在正式發布Web信息之前往往需要設置一下IIS伺服器,以便確保單位的Web網站可以始終如一地穩定運行。然而很多時候,我們都會遇到Web伺服器訪問失敗的故障現象,面對Web伺服器故障,我們往往會表現得手忙腳亂,根本不知道該從何處著手,來解決這些Web伺服器故障。其實,造成Web伺服器故障的因素有很多,我們需要對此進行逐一排查,才能高效解決對應的Web伺服器故障現象。Web伺服器故障現象為了充分展示單位的形象,擴大單位的知名度,單位領導要求網路管理員,立即拿出方案,組建有個性化特色的Web站點,不僅確保單位內部的員工可以通過內網正常訪問Web站點,同時還要保證外網用戶也能快速地訪問到本單位的站點內容。依照領導指示精神,網路管理員立即行動,挑選了一台運行性能非常高效的計算機作為伺服器系統,並在其中安裝、配置了Windows Server 2003系統,同時利用該系統自帶的IIS組件架設了Web伺服器;為了提高Web站點的訪問速度,網路管理員特地將Web站點所在的計算機直接連到單位千兆核心交換機上,同時將目標主機的IP地址設置成與單位普通員工所用計算機處於相同網段的地址。剛開始的時候,無論是內網用戶,還是外網用戶,所有用戶都能正常地訪問單位的Web站點。可是,沒有多長時間,單位內網用戶在訪問Web站點時,就遇到了訪問失敗的Web伺服器故障,具體表現為無論從哪一台客戶端系統出發,使用內網地址訪問單位的目標站點時,系統屏幕上都會彈出身份驗證對話框,要求單位員工必須輸入訪問賬號與密碼,可是當網路管理員嘗試以Web站點的系統管理員身份進行登錄操作時,發現始終登錄不進去;更讓人感覺到不可理解的是,網路管理員趕到Web伺服器現場,查看其安全配置時,發現目標Web站點根本就沒有啟用登錄驗證設置,那身份驗證對話框究竟是怎麼彈出來的呢?Web伺服器故障排查由於造成這類Web伺服器故障的因素比較多,我們必須要對各種可能因素進行依次排查,才能找到具體的Web伺服器故障原因,啟凡合肥網路公司分析如何採取針對性措施來快速解決故障現象:1、檢查安全登錄設置考慮到在訪問目標Web站點的時候,系統彈出了身份驗證對話框,這就意味著目標Web站點可能在安全登錄方面沒有配置正確,造成了用戶訪問Web內容時必須要輸入訪問賬號。依照這樣的分析思路,網路管理員准備先檢查一下Web伺服器的安全登錄配置參數,看看其中的設置是否正確;想到做到,網路管理員立即來到目標Web主機現場,以特權賬號登錄其中,並依次單擊「開始」/「設置」/「控制面板」選項,從彈出的系統控制面板窗口中,找到「管理工具」功能圖標,並用滑鼠雙擊該圖標選項,進入對應系統的管理工具列表窗口;接著再用滑鼠雙擊IIS功能圖標,彈出對應系統的IIS主控台窗口,從該窗口的左側列表區域,找到目標Web站點所在的計算機名稱,並用滑鼠右鍵單擊該計算機名稱,從彈出的右鍵菜單中執行「屬性」命令,彈出目標Web主機的屬性設置窗口;在該屬性設置窗口中點選「目錄安全性」選項卡,打開目錄安全性選項設置頁面;下面,在該設置頁面的「身份驗證和訪問控制」設置項右邊,單擊「編輯」按鈕,進入身份驗證和訪問控制設置對話框,網路管理員發現其中的「匿名訪問」、「集成Windows驗證」等選項都處於選中狀態,於是他嘗試著將這些參數選項取消選中,之後重新從內網的一台計算機中進行Web訪問,可是相同的故障現象仍然存在;於是,網路管理員再次選中了「匿名訪問」、「集成Windows驗證」等選項,可是讓他感覺非常失望的是,上面兩個選項無論是選中還是沒有選中,好像故障現象都存在,這就說明目標Web主機的安全登錄設置與上面的故障現象並沒有什麼關系。2、檢查上網連接設置既然登錄設置以及許可權設置,都影響不了Web伺服器訪問失敗的故障現象,那問題可能出在其他地方。考慮到單位的Web伺服器自從搭建成功後,網路管理員很少去改動它,那麼伺服器自身出現問題的可能性比較小,於是網路管理員決定從普通客戶端的網路連接設置著手,看看是否是客戶端自身原因引起的。網路管理員擔心區域網中可能存在ARP病毒,造成了普通客戶端系統訪問目標Web站點時,上網數據包被強行轉發到其他的主機上了,於是他立即登錄進入單位區域網的核心交換機後台系統,並利用系統自帶的診斷命令,對內網中每一個上網埠進行了掃描、診斷,結果發現所有上網埠的工作狀態都是正常的,而且內網網路中也不存在由ARP病毒引起的地址沖突現象,這說明內網網路中不存在ARP病毒。接著網路管理員又對幾台普通客戶端系統的網路線纜連通性進行了測試,發現它們的狀態也是正常的,並且從客戶端系統中執行ping命令,來測試目標Web站點IP地址的連通性時,也是正常的,這說明普通客戶端系統是可以正常訪問目標Web站點的。後來,網路管理員擔心客戶端系統採用了代理區域網方式上網,因為採用這種方式訪問目標Web站點時,需要先輸入代理伺服器的登錄賬號與密碼,難道我們在進行Web站點訪問操作時,系統屏幕彈出的身份驗證對話框,是針對代理伺服器的?為了排除這種因素,網路管理員立即打開客戶端系統的IE瀏覽器窗口,依次單擊其中的「工具」/「Internet選項」,打開Internet選項設置對話框,單擊其中的「連接」標簽,並在對應標簽設置頁面中,網路管理員發現本地客戶端系統並沒有啟用代理伺服器設置,這說明Web伺服器訪問失敗的故障與客戶端系統的上網連接設置沒有任何關系。3、檢查目錄訪問許可權會不會是目標Web站點所指向的主目錄,對普通用戶的訪問許可權進行了限制呢?聯想到在搭建FTP站點時,如果不對FTP站點的主目錄開放用戶訪問許可權的話,那麼普通用戶是無法通過IE瀏覽器登錄進入FTP站點的;為此,網路管理員立即打開目標Web站點的系統資源管理器窗口,從中找到對應的主目錄,用滑鼠右鍵單擊該主目錄,從彈出的快捷菜單中執行「屬性」命令,打開對應主目錄的屬性設置對話框;點選其中的「安全」選項卡,網路管理員看到其中並沒有everyone賬號的訪問許可權,難道是沒有對everyone賬號進行授權,造成了Web伺服器訪問失敗的故障現象?為了驗證這樣的猜測是否正確,網路管理員立即單擊安全選項設置頁面中的「添加」按鈕,將everyone賬號添加到賬號列表中來,同時為該賬號設置了合適的訪問許可權,最後單擊「確定」按鈕執行設置保存操作,原以為這樣的設置操作可以解決問題了,不過網路管理員再次嘗試從普通客戶端系統進行Web站點的訪問操作時,發現還是無法成功,很明顯造成上述故障現象的因素可能不是目錄訪問許可權。4、檢查授權模式配置在排除了客戶端系統的自身因素後,網路管理員再次將目光聚焦到Web伺服器身上。經過上網咨詢相關問題,網路管理員估計Windows Server 2003伺服器系統的授權模式可能被意外修改,因為伺服器授權模式要是設置不當時,很可能出現用戶無論輸入什麼登錄賬號都無效的故障現象。想到做到,網路管理員立即登錄進入Web伺服器系統,依次單擊「開始」/「設置」/「控制面板」命令,在彈出的控制面板窗口中雙擊「授權」圖標,彈出授權模式配置窗口,在這里網路管理員發現目標Web站點當前使用的是「每伺服器」授權模式;為了判斷該參數是否對Web訪問有影響,網路管理員將授權模式修改為了「每設備或用戶」選項,並且重新啟動了一下Web伺服器系統,然而這樣的調整也沒有取得任何效果,看來授權模式配置也對Web訪問操作沒有直接的影響。5、檢查其他Web服務經過上述排查,網路管理員確認Web伺服器以及客戶端系統自身狀態都是正常的,單位內網的線路也是正常的,那為什麼客戶端系統偏偏會在訪問單位Web站點時,彈出身份驗證對話框,並且無論輸入什麼用戶賬號都沒有用呢?經過仔細分析,網路管理員估計區域網中可能同時存在其他的Web服務,而其他Web服務恰好又搶用了單位Web伺服器的站點地址,最後造成了單位員工在進行Web訪問時,實際上是訪問了其他一個沒有經過正確配置的Web站點。正當網路管理員准備排查區域網中究竟是否存在其他的Web服務時,一個故障電話突然打了進來,說單位新買的列印機突然無法正常網路列印了,那麼這個故障會不會與Web伺服器訪問失敗現象有什麼必然的聯系呢?想到這一點,網路管理員立即趕到網路列印機現場,登錄進入該設備的後台管理頁面,檢查其配置參數時,發現該設備的日誌頁面提示說存在地址沖突現象,仔細一看,網路管理員發現那個沖突的地址竟然就是單位Web站點的地址,難道我們從內網客戶端系統訪問目標站點時,訪問的卻是列印機後台管理系統?既然存在地址沖突現象,網路管理員立即動手為網路列印機重新分配了一個地址,之後他再次對目標Web站點進行了訪問操作,這一次很順利地打開了對應站點內容,顯然Web伺服器故障現象已經被成功解決了。Web伺服器故障總結經過更深入地檢查,網路管理員發現列印機設備默認運行了Web服務,那樣一來列印用戶就能通過Web方式對列印設備進行遠程管理;而在默認狀態下網路列印機沒有啟用匿名訪問功能,如此一來當網路列印機使用了單位Web站點的IP地址時,上網用戶其實訪問的就是列印機後台管理頁面,而該頁面是需要進行身份驗證的,這也是普通用戶為什麼訪問目標站點時會彈出身份驗證對話框的原因了,而網路管理員由於沒有輸入網路列印機授權的用戶賬戶,才會出現無論輸入什麼用戶賬號也不能成功登錄的現象了。此次Web伺服器故障的元兇就是這個原因。回顧上面的Web伺服器故障排除過程,我們發現此次的Web伺服器故障排查其實很簡單,如果我們能夠及時注意到區域網中新增加了網路列印機的話,那麼在進行故障排查時我們或許就能注意到該變化會對Web伺服器故障造成影響了。為此,我們日後在排查網路故障之前,應該先觀察網路環境中是否存在變化,如果有變化的話,再對該變化展開針對性思考與聯想,那樣的話故障解決起來就不會繞彎子了。
❷ linux伺服器故障怎麼去排查
故障排查要分兩種情況進行排查,首先排查下硬體,看硬體是否有問題,其次再排查下伺服器系統設置、軟體設置等是否存在問題。在這里還有個比較重要的就是看下伺服器是否是受到了攻擊,導致出故障的。
作為伺服器是很容易受到攻擊的,建議要安裝安全狗之類的伺服器防護軟體來確保伺服器安全哦。
❸ 如何快速修復伺服器問題
伺服器常見故障現象及解決方法:
問題一:伺服器無法啟動
主要原因: ①市電或電源線故障(斷電或接觸不良)②電源或電源模組故障③內存故障(一般伴有報警聲) ④CPU故障(一般也會有報警聲) ⑤主板故障 ⑥其它插卡造成中斷沖突
解決方法:①檢查電源線和各種I/O接線是否連接正常。
②檢查連接電源線後主板是否加電。
③將伺服器設為最小配置(只接單顆cpu,最少的內存,只連接顯示器和鍵盤)直接短接主板開關跳線,看看是否能夠啟動。
④檢查電源,將所有的電源介面拔下,將電源的主板供電口的綠線和黑線短接,看看電源是否啟動。
⑤如果判斷電源正常,則需要用替換法來排除故障,替換法是在最小化配置下先由最容易替換的配件開始替換(內存、cpu、主板)
問題二:系統頻繁重啟
主要原因:①電源故障(替換法判斷解決)
②內存故障(可從BIOS錯誤報告中查出)
③網路埠數據流量過大(工作壓力過大)
④軟體故障(更新或重裝操作系統解決)
問題三:伺服器死機故障判斷處理
伺服器死機故障比較難以判斷,一般分為軟體和硬體兩個方面。
1、第一方面-軟體故障
①首先檢查操作系統的系統日誌,可以通過系統日誌來判斷部分造成死機的原因。
②電腦病毒的原因。
③系統軟體的bug或漏洞造成的死機,這種故障需要在判斷硬體無故障後做出,而且需要軟體提供商提供幫助。
④軟體使用不當或系統工作壓力過大,可以請客戶適當降低伺服器的工作壓力來看看是否能夠解決
2、第二方面-硬體故障
①硬體沖突
②電源故障或電源供電不足,可以通過對比計算伺服器電源所有的負載功率的值來作出判斷。
③硬碟故障(通過掃描硬碟表面來檢查是否有壞道)
④內存故障(可以通過主板BIOS中的錯誤報告和操作系統的報錯信息來判斷)
⑤主板故障(使用替換法來判斷)
⑥CPU故障(使用替換法)
⑦板卡故障(一般是SCSI/RAID卡或其他pci設備也有可能造成系統死機,可用替換法判斷處理)
注意:系統死機故障需要在處理完後需要在一段時間內進行一定壓力的拷機測試來盡一步檢查故障是否徹底解決。
伺服器可分為國內與國外伺服器,實在解決不了可以尋求美國主機偵探查找原因,或者聯系相關客服。
❹ 蘋果手機出現伺服器出現問題怎麼辦
解決方法如下:
方法一:系統設置問題
1、檢查一下系統設置數據是否關閉所至,蘋果手機顯示連接apple id伺服器時出錯100%的原因都是因為關閉掉系統設置數據造成的,首先請依次打開蘋果手機系統設置,進入到蜂窩移動數據裡面。
❺ 伺服器宕機怎麼辦伺服器故障應急預案
昨日攜程旅行網站打不開伺服器故障,相信大家也看到攜程科技大樓徹夜明燈加緊整修的壯觀場景,那麼對於伺服器宕機怎麼辦?本文小編就來教一下大家伺服器故障應急預案。
首先分清導致伺服器出故障的因素:
1、外部攻擊
2、內部攻擊
3、運維誤操作
伺服器宕機怎麼辦?伺服器故障應急預案
不管是外部攻擊還是內部故障,備份好以及冗餘措施,可以使宕機時間縮短到最低。
備份問題盡管聽起來不可思議,但在實踐中,不少企業並未建立起一套檢驗過的備份系統。備份的意義在於危急時刻可以快速恢復或重建生產系統。在企業網路中,經常出現的問題實際上是:
備份步驟的瑕疵導致並未完成正確的備份過程
由於有限的存儲空間導致一定時間後因存儲空間耗盡導致的隨後備份失敗
備份介質受損導致無法成功恢復
傳統上,磁帶因其低造價以及高存儲密度使其成為了理想的備份介質。然而,這種傳統備份介質的幾個致命缺點經常使其內含的數據變得不可存取:
丟失的磁帶索引卡片
磁帶介質在存儲過程中容易受到外界磁場影響
介質本身損壞
介質讀取過程中被讀取設備損壞
此外,磁帶備份介質本身存儲在磁帶倉庫中,從倉庫檢索所需的備份磁帶、轉移至數據中心並重新載入數據的時間消耗通常也是客觀的。
即使有一套備份系統仍然是不能抵擋所有的意外事故的。2014 年, Samsung 數據中心的一場大火使其雲服務暫停服務。如果沒有異地備份,這場大火將使其本地備份的恢復變得極為困難。
冗餘對於突發性事件來說,盡快恢復,或者是持續的提供服務是非常重要的。本月,某知名支付公司因數據中心網路連接性故障導致了一段時間的服務中斷。如果有更好的冗餘方案,此種事故的影響面將會得以降低,甚至會化解為用戶不可感知的內部事故。
大部分伺服器都有兩部獨立的 PSU,任意一部 PSU失效並不會影響其正常服務;一般來說,伺服器的兩部 PSU 將連接到兩路不同的電路或不間斷電源上以避免市電失效;數據中心電源多數同時配備 UPS 和柴油發電機來避免發電公司未通知的停止供電服務導致的服務中斷。網路亦然;同時接入多路 ISP 線路,並對其進行獨立布線,同時在多條線路上宣告地址,便可使得網路服務的魯棒性更高。
在系統的視角上,只有同時配置好的備份以及冗餘方案,才能提高可用性,避免非可控因素導致的長時間服務中斷。
伺服器宕機怎麼辦?伺服器故障應急預案就為大家介紹到這里
❻ 如何快速排除網路連接故障的六大步驟
網路是計算機之間連接的橋梁,也是用戶獲取外界信息的通道,當計算機網路出現故障時,如何迅速地排除故障,找到解決的方法呢,可以用以下六個步驟來順利排除故障原因:
第1步:檢驗電纜
首先,檢查計算機與網路插口之間的電纜。對於10/100網路環境,只需一種能檢查開路、短路和布線的工具即可工作。而對於千兆乙太網,則還需檢查電纜中是否存在串擾和阻抗故障。推薦使用電纜鑒定測試器,它可在實時網路中測試串路和阻抗故障。
第2步:確認連接到交換機
將攜帶型網路工具連接到辦公室線路,檢查是否可以建立鏈路。如果埠被管理員關閉,則工具將無法連接。接著,檢查埠配置以確保埠可用且已按正確的 VLAN進行配置。為獲得最佳結果,應使用可支持10/100/Gig連接的工具。不過,通常10/100連接的工具即可工作。
第3步:申請DHCP地址
一旦建立鏈路之後,即可使用工具從伺服器申請DHCP地址。應確保分配的地址與相應的子網相符;檢驗子網掩碼;確認默認網關和DNS伺服器地址。如果工具未能從伺服器獲得響應,它應該可以通過分析廣播流量檢測出相應的子網。通過從交換機獲得的Cisco發現協議(CDP)報告,檢查工具所連接的交換機埠,並確認子網配置。
第4步:Ping網路上的設備
一旦獲取 DHCP地址之後,即可使用工具ping一台區域網外的設備。這可確認DHCP伺服器的指定配置是否正確以及網路流量是否被正確地路由發送。這時,網路連接已經過測試,因此計算機可重新連接到網路。對於持續性網路連接問題,最好在計算機和網路之間在線連接工具以進行附加的診斷。
第5步:檢驗速度/雙工模式設置
某些鏈路性能故障如雙工模式不匹配、速度不匹配以及靜態配置IP地址等都只能進行在線檢測。因此,我們強烈推薦使用具有在線檢測功能的工具。在計算機和網路之間以在線方式連接工具。確認所連接交換機埠的速度設置和雙工模式設置與相應計算機的設置相符。如果檢測到雙工模式不匹配,則確認計算機和交換機埠是否均已被設成自動協議。
第6步:網路流量監控
通過在線工具檢查計算機是否成功地向DHCP伺服器申請並接收到地址。這種工具應能同網路建立獨立的連接,然後再與計算機建立連接。接著,使用計算機連接到電子郵件伺服器或應用伺服器,並通過工具監控網路流量。查找過多的廣播、沖突或錯誤。一旦檢驗完所有這些參數之後,計算機與網路之間的鏈路即可取消。如果故障仍然存在,則可能需要使用更加精密的網路診斷工具。
❼ 伺服器硬體故障要如何排查和判斷
常見伺服器硬體故障排查判斷:伺服器常見故障的診斷與解決:伺服器故障排除第一部分 伺服器故障排除的基本原則性問題伺服器故障排除一、伺服器開機黑屏故障排查1.檢查供電環境,零-火;零-地電壓?2.檢查電源指示燈,如果亮,正常嗎?3.按下電源開關時,鍵盤上指示燈亮嗎?風扇全部轉動嗎?4.是否更換過顯示器,更換另一台顯示器。5.去掉增加內存6.去掉增加的CPU7.去掉增加的第三方I/O卡8.檢查內存和CPU插的是否牢靠9. Clear CMOS10.更換主要備件,如系統板,內存和CPU伺服器故障排除二、伺服器故障排除的基本原則1.盡量恢復系統預設配置a:硬體配置:去除第三方廠商備件和非標配備件;b:資源配置:清除CMOS,恢復資源初始配置;c: BIOS,F/W,驅動程序:升級最新的BIOS,F/W和相關驅動程序;d: TPL:擴展的第三方的I/O卡屬於該機型的硬體兼容列表(TPL)嗎?2.從基本到復雜a:系統上從個體到網路:首先將存在故障的伺服器獨立運行,待測試正常後再接入網路運行,觀察故障現象變化並處理。b:硬體上從最小系統到現實系統:指從可以運行的硬體開始逐步到現實系統為止。c:軟體上從基本系統到現實系統:指從基本操作系統開始逐步到現實系統為止。3.交換對比a:在最大可能相同的條件下,交換操作簡單效果明顯的部件;b:交換NOS載體,既交換軟體環境;c:交換硬體,既交換硬體環境;d:交換整機,既交換整體環境;伺服器故障排除三、伺服器故障排除需要收集哪些信息?伺服器信息:1.機器型號2.機器序列號(S/N:如:NC00075534)3.Bios版本4.是否增加其它設備,如網卡,SCSI卡,內存,CPU5.硬碟如何配置,是否做陣列,陣列級別6.安裝什麼操作系統及版本(Windows Server, Netware, Sco, others)
故障信息1.在POST時,屏幕顯示的異常信息2.伺服器本身指示燈的狀態?3.報警聲和BEEP CODES4. NOS的事件記錄文件?5. Events Log文件
確定故障類型和故障現象:1.開機無顯示;2.上電自檢階段故障;3.安裝階段故障和現象;4.操作系統載入失敗;5.系統運行階段故障.
❽ 如何排除伺服器死機故障
我們在之前關於3GB切換(/3GB switch)的一篇文章中簡要地介紹了系統PTE.PTE是用來跟蹤內存中頁面的結構,好比圖書索引告訴你圖書內容在哪一頁上。PTE告訴系統數據駐留在內存的哪一個物理頁面上。機器從固定數量的PTE開始--系統中的內存越多,需要越多的PTE指向內存頁面。如果系統耗盡了可用的頁面表項,它再也無法分配內存,因而導致系統死機或毫無反應。 遺憾的是,系統PTE耗盡時,系統日誌中沒有什麼條目表明這個問題。不過,你可以使用性能監視器(Performance Monitor)來監視空閑系統PTE.沒有計數器詳細分解每個進程的PTE使用情況,所以單單使用性能監視器來查明PTE耗盡的根源並非總是切實可行。你也許能夠將進程的句柄數量不斷上升(句柄泄漏)與PTE耗盡關聯起來,然而除非存在明顯的根源,否則就要內存轉儲或實時調試。 所以概括起來,下面是系統完全死機後需要遵循的幾個簡單步驟: 1. 這是硬死機還是軟死機?如果這是硬死機,那麼很可能是底層硬體出了問題,所以就要聯系硬體廠商。 2. 檢查事件日誌,查找發生死機時事件日誌中的任何事件。以頁面池耗盡為例,你會看到事件編號2019或2020,事件來源是SRV. 3. 啟動性能監視器,檢查內存對象下面空閑系統PTE的起始值。如果系統啟動時,空閑系統PTE少於正常值(大約15000或更少),那麼這不是個好兆頭。這意味著,所有PTE在啟動時已被耗盡,因而可供伺服器正常操作使用的資源就比較少了。 4. 創建性能監視器日誌,讓它運行一段時間。起碼要添加針對內存、進程、處理器和系統的計數器。你需要讓日誌運行多長時間,取決於系統多久過後出現死機(假設死機問題一再發生)。設好間隔時間,以便你能夠在日誌有效期內捕捉到至少100個樣本。任何內存偏低的情況都應該一目瞭然--如果這種泄漏很穩定的話,更是如此。
❾ 宕機伺服器如何排查故障
宕機伺服器排查故障方法
1、在運行環境的問題中,最普遍的問題時磁碟空間耗盡。
2、在性能問題中,最普通的伺服器宕機原因確實是運行很糟糕的SQL,但也不一定都是這個原因,比如也有很多問題時由於伺服器Bug或錯誤的行為導致的。
3、糟糕的Schema和索引設計是第二大影響性能的問題。
4、復制問題通常由於主備數據不一致導致。
5、數據丟失問題通常由於操作的錯誤操作導致,並總是便隨著缺少可用備份的問題。
6.由於系統原因,導致的伺服器宕機,一般重啟下伺服器就可以。
明白了伺服器宕機的原因,我們就可以採取相應的措施來排查。宕機伺服器如何排查故障
❿ 伺服器常見故障是什麼,怎麼排除
1、伺服器常見的故障及其排除方法
伺服器中的某項服務被停止 •系統資源不足 •伺服器軟體故障
伺服器軟體故障是在伺服器故障中佔有比例最高的部份,約佔70%。導致伺服器出現軟體故障的原因有很多,最常見的是伺服器BIOS版本太低、伺服器的管理軟體或伺服器的驅動程序有BUG、應用程序有沖突及人為造成的軟體故障。伺服器軟體設置不當也會可能造成網路故障。
管理方面的問題
如用戶的帳戶和安全設置方面的潛在問題,服務許可權沒有給用戶、配置不當或限制某些服務等問題
2 伺服器故障排除的基本原則
伺服器故障排除的基本原則如下:
(1) 盡量恢復系統預設配置
(2) 從基本到復雜
首先將存在故障的伺服器獨立運行,待測試正常後再接入網路運行,觀察故障現象變化並處理;然後從可以運行的硬體開始逐步到現實系統為止;最後從基本操作系統開始逐步到現實系統為止。
(3)交換對比
首先在最大可能相同的條件下,交換操作簡單效果明顯的部件;其次是交換軟體環境;再者是交換硬體,既交換硬體環境;最後是交換整機,既交換整體環境。
在伺服器故障排除時,需要收集如下一些信息:
伺服器信息:機器型號(P/N:)、機器序列號(S/N:)、Bios 版本、是否增加其它設備(如網卡,SCSI 卡,內存,CPU等)、硬碟如何配置和安裝什麼操作系統及版本。
故障信息:在POST(加電自檢)時,屏幕顯示的異常信息、伺服器本身指示燈的狀態和報警聲,以及操作系統的事件記錄文件等信息。
確定故障類型和故障現象:開機無顯示;上電自檢階段故障;安裝階段故障和現象;操作系統載入失敗和系統運行階段故障。