當前位置:首頁 » 存儲配置 » 存儲換盤過快導致業務故障

存儲換盤過快導致業務故障

發布時間: 2023-07-13 19:05:36

㈠ 電腦存儲問題,開機時候發生故障。

1、仔細觀察

排除故障之前需要仔細觀察電腦,首先檢查電腦周圍的環境,比如放在什麼位置,使用的交流電源穩定性怎樣,外部設備、主板外的其他設備的情況及溫度與濕度等;其次查看電腦故障所表現的現象、顯示的內容,與正常情況下相比有哪些不同的地方;第三認真查看電腦內部的環境情況——灰塵、連接情況,元器件的顏色、形狀、指示燈的狀態等;最後檢查電腦的軟硬體配置——安裝了何種硬體、資源的使用情況,使用的是何種操作系統,安裝了何種應用軟體,使用的硬體驅動程序版本等。

2、根據觀察先分析再動手

排除故障,有時簡單,有時復雜、困難。一般來說,對於所觀察到的現象,盡可能地先查閱相關的資料,看有無相應的技術要求、使用特點等,然後根據查閱到的資料,結合故障排除方法再著手進行排除。

3、必須先軟後硬

從整個故障判斷的過程,總是先判斷是否為軟體故障。當判斷軟體運行環境正常時,如果故障還沒有消失,再從硬體方面著手診斷。

4、分清主次,抓主要矛盾

在出現故障現象時,有時可能會看到一台故障機不止有一個故障現象,而有兩個或兩個以上的故障現象(如:啟動過程中無顯示,但同時主機也在啟動,啟動完後有死機的現象等)。此時,應該先判斷、排除主要的故障。當故障點解決了可能次要故障就自然解決了。

二、軟體故障排除方法與原則

軟體故障一般能夠從故障現象上直觀反映出來。如果是系統故障會提示系統出錯的信息,如果是某個軟體出現故障就會導致軟體運行不正常。下面來看看軟體故障的一些排除原則。

1、操作系統

主要的故障點有操作系統的啟動文件出錯,系統配置參數錯誤,組件文件損壞、病毒破壞等。

(1)修復操作系統啟動文件

對於Windows 9x系統,可用SYS命令來排除(保證Msdos.sys的大小在1KB以上),排除之前保證分區參數是正確的。對於Windows 2000/XP系統,有兩種方法:修復啟動文件,使用fixboot c(如:fixboot c:)命令;修復主引導記錄,使用fixmbr(如:fixmbr /mbr)命令。

(2)調整操作系統配置文件

對於Windows 9x系統,可用的工具軟體很多,如Msconfig命令,系統文件檢查器、注冊表備份和恢復命令(如Scanreg.exe,它要求在DOS環境下運行,另外,如果要用Scanreg.exe恢復注冊表,最好使用所列出的恢復菜單中的第二個備份文件)等。對於Windows 2000系統,可用的工具軟體與Windows 9x相比較少,但某些調試命令可用Windows 98中的一些命令(如Msconfig命令,就可用在Windows 2000下)。對於Windows XP系統,可用的工具軟體主要是Msconfig命令。調整電源管理和有關的服務,可以使用的命令是Gpedit.msc。所有操作系統的調試都可通過控制面板、設備管理器、計算機管理器(Windows 9x系統無)來進行。

(3)組件文件(包括DLL、VXD等)的修復

一般採用以下的方式來進行:通過從CAB文件中提取安裝、可用系統文件檢查器(Sfc.exe命令)來修復有錯誤的文件、從運行正常的電腦上拷貝覆蓋。

(4)檢查系統中的病毒

最直接的是使用命令行方式下的病毒查殺軟體殺毒,最好能直接訪問NTFS分區。

2、設備驅動程序安裝與配置

主要看設備驅動程序是否與設備匹配,版本是否合適、相應的設備在驅動的作用下能否正常響應。

最好先由操作系統自動識別(一些有特別要求的顯卡驅動程序、音效卡驅動程序、非即插即用設備的驅動程序等除外),而後考慮強行安裝。這樣有利於判斷設備的好壞。如果有操作系統自帶的驅動程序,則先使用,仍不能正常使用或不能滿足應用需要,則使用設備自帶的驅動程序。更換設備應先卸載驅動程序後再進行。卸載驅動程序,可從設備管理器中卸載,再從安全模式下卸載,進而在INF目錄中刪除,最後通過注冊表卸載,更新驅動程序時,如直接升級有問題,須先卸載再更新。

3、磁碟狀況

檢查磁碟上的分區是否能訪問、存儲介質是否有被損壞的可能、保存在磁碟上的文件是否完整等。可用於調整的工具軟體有: DiskMan,可方便地找回正確的分區。Fdisk及Fdisk/MBR,檢查分區是否正確及使主引導記錄恢復到原始狀態。當硬碟容量大於64GB時,如果要重新分區或查看分區,要求使用隨機附帶的磁碟分區軟盤中的Fdisk命令。這個命令可用Windows Me下的Fdisk命令來代替。Format、Scandisk及廠商提供的磁碟檢測程序,可檢查磁碟介質是否有壞道。當文件不完整時,對不完整的文件先進行改名,再在操作系統中重建。

4、應用軟體

這類故障如應用軟體是否與操作系統或其他應用有兼容性的問題,使用與配置是否與說明手冊中所述的相符、應用軟體的相關程序、數據等是否完整等。遇到這類故障先查看軟體配置是否行當,若仍不能排除故障,最後可以在備份重要數據的情況下卸載應用軟體,然後重新安裝應用軟體。

5、BIOS設置

把BIOS恢復到最優狀態(一般是出廠時的狀態),然後根據應用的需要,逐步設置到合適值。BIOS不一定要刷新到最新版,有時應考慮降低到兼容性最好的版本。

6、重建系統

若硬體配置正確,可通過重建系統的方法來判斷操作系統的軟體故障,或使用自帶的硬碟來進行重建系統的操作(在這種情況下,最好重建系統後逐步復原到用戶原硬碟的狀態,以便判斷故障點)。

重建系統,以一鍵修復為主,其次是恢復安裝,最後是完全重新安裝。恢復安裝的方法:對於Windows 9x系統,直接從光碟安裝,或執行tools\sysrec\pcrestor.bat即可實現。在進行恢復安裝時,可能由於Win.com的存在而影響安裝過程的正常進行這時在Windows目錄下刪除Win.com後,再重新安裝。另一種恢復安裝,是將根目錄下的System.1st改名System.dat後覆蓋掉Windows目錄下的同名文件,然後重啟即可。但這種方法不是真正意義上的重新安裝,而是類似於完全重新安裝。對於Windows XP或Windows 2000系統,直接使用其安裝光碟啟動在安裝界面中選擇修復安裝,選擇「R」時會出現兩個選項:一是快速修復,對於簡單問題用此選擇;另一是故障修復台,只要選擇正確的安裝目錄就可啟用故障修復台。

為保證系統干凈,在重新安裝系統前,執行Fdisk/MBR命令(也可用Clear.com)。必要時在此之後執行format<驅動器盤符>/u[/s]命令。

三、硬體故障診斷方法與原則

出現硬體故障首先需要對計算機運行環境進行檢查,排除由於計算機運行環境本身的故障造成計算機各種不同的症狀。排除了計算機外部因素的干擾,才能確定計算機本身的故障。下面就來看看硬體常出現故障的診斷方法和排除原則。

1、硬體環境檢查

這是診斷硬體故障首先要做的事情,具體的步驟如下:

(1)市電源檢查。首先用萬用表檢查市電的供電電壓是否在220V的5%范圍內,然後檢查市電是否穩定,有無停電或瞬間停電的現象。如果有不穩定的現象或者有時停電,則採取相應的穩壓措施,比如添加UPS設備等。接著用試電筆檢查電源插座是否為左零(線)右火(線),然後用萬用表檢查市電插座的零線與地線是否短路、零線是否懸空,如果是,重新連接市電電源線。再檢查市電的穩壓設備的技術規格是否與主機電源相兼容,如果不兼容,則需要更換穩壓設備。最後檢查電源線在市電插座是否插接牢靠,有無松動現象,然後根據現象更換電源插頭或電源線。

(2)開關檢查。首先用萬用表檢查主機電源開關的斷通情況,傾聽開關打開或關閉的聲音,檢查是否清脆,看是否有連鍵或無聲現象。然後根據情況更換開關。接著用萬用表檢查主機電源開關連線是否良好,必要時更換開關線。最後檢查主板上PW—SW接針是否有接觸不良現象,如有還需要更換主板來測試。

(3)主機電源連接檢查。首先用萬用表檢查電源線主機一端是否有正常的電壓,通過擺電源線檢查其電壓是否穩定。接著檢查電源插頭插入主機電源插座後是否已插到位,是否過松或可擺動,根據不同的情況更新插接或更換電源線。接下來檢查主機內部矛盾電源到主板及其他設備的電源連接是否正確。最後檢查主機電源的輸出是否穩定,若輸出超階級出范圍,必要時需要更換電源。

(4)電池檢查。這主要檢查主板電池是否正常工作。首先檢查電池與電池夾的連接是否接觸良好,注意需要先對電池容納空間進行有效的清洗。再用萬用表檢查,主板上的電池電壓是否過低,低於2.8V就需要更換一顆新的電池。最後用萬用表檢查電池的供電電流是否過大,一般不超過10MA,否則要更換主板。

經過環境檢查後,排隊由於外部因素造成的計算機硬體故障。接下來根據不同的硬體故障現象給出相應的解決方法。首先說明的是,要解決故障不需要做完所有的步驟,有些問題可能只需要做完其中一個步驟後就能解決,有可能有些故障需要幾個步驟後才能解決。也有可能有些故障在經歷所有步驟後都不能解決但是根據以下步驟進行排查,可以不斷地縮小發生硬體故障的范圍。最後確定故障發生的具體部件。推薦在做完第一個步驟以後都進行必要的測試,以便確定問題部件。

2、啟動電源類故障

啟動電腦的時候,產生按主機電源開關鍵後指示燈不亮,或指示燈亮一下就來,或開機後一會就斷電,或一開機後一會即斷電,或每天第一次開機時不加電而要等很長時間才啟動等情況。

解決方法:

(1)首先檢查是否接有漏電保護器,或主機是否接有地線,如果沒有接,則有可能是整機漏電或有故障。這需要檢查電源,再根據市電線路上連接的電腦台數(不超過20台)和漏電保護器的容量更改線路或加大漏電保護器容量。

(2)接著檢查是否設置過其他開機方式或載入了開機控制軟體。如果載入了這方面的軟體,需要清除BLOS數據,卸載相應的開機控制軟體。

(3)接著認真檢查主機內部空間,部件與機箱之間及灰塵等,看是否造成了短路現象,如果有則排除短路故障,並進行必要的除塵工作。

(4)接著通過敲打法檢查有無虛接現象,然後重新插拔板卡或列換相應的部件,檢查板卡與插槽或與機箱間的配合然後在最小硬體系統下,開機檢測故障是否消失。如果消失,故障是由其他部件或連線引起的,通過逐步添加的方法排除故障源。

(5)接著在電源不加負載的情況下,看能否加電。如果也不能或能加電但輸出電壓不穩定,則需要更換電源進行測試。如果故障消失了,則是電源故障,其具體的方法是電源不加負載,在電源接上市電的情況下,用萬用表檢測電源的綠線在按下開關時能否從5V跳變為OV,或者將電源的綠線與地短接,看電源能否立即工作以及輸出電壓是否正常。然後在最小系統下用萬用表測試電源電壓的輸出范圍及穩定性。如果輸出電壓已不在允許范圍或不穩定,也說明是電源故障。

(6)如果在更換電源後故障依舊,則繼續檢查主機電源開關的通斷情況(如開關的聲響、按紐是否正常回位等)。如果開關有問題,則需要更換開關。最後用CPU假負載代替CPU測試。如果可加電且主板輸出的CPU電壓正常,則為CPU故障;或者替換主板測試如果故障得到解決,則說明是主板故障。

3、啟動異常類故障

電腦能夠加電,但在啟動的時候發生了開機無顯示無報警提示,或開機無顯示但有報警提示,或開機有顯示但自檢報錯或死機,或者出現反復重啟或斷電的情況。

對於開機無顯示情況的解決方法:

(1)確認電腦是否有自檢的聲音如果有,則按顯示類故障進行分析判斷。

(2)如果BIOS支持BOOTEASY功能,先關閉這個功能,出現錯誤提示信息,則需要認真查看錯誤提示信息,並根據信息檢查相關的部件。如果提示內存出錯,則檢查內存:如果提示磁碟出錯,則根據後面的磁碟類故障檢查方法進行檢查。如果提示CMOS錯誤,則BLOS設置後重新保存,或更換相應的硬體。

(3)接著查看CPU風扇的運行情況。CPU風扇應該轉速平穩,應感覺有倒轉的錯覺現象,如果沒有,那麼需要更換CPU風扇。因為CPU風扇故障也極有可能造成CPU風扇故障。

(4)接著清除BLOS數據或檢查主板跳線設置。

(5)在最小硬體系統下,看故障是否消失。如果故障消失,則故障是由其他部件或連線引起,通過逐步添加的方法排除。如果在最小系統下還有報警聲則是由其他部件、內存或連接的信號線引起的,可通過逐次加入的方法查找故障源。

(6)最後最好能插上POST卡檢查,這里需要注意CIH病毒引起的故障。如果POST卡顯示的與內存相關,那麼插入新內存(在這里要求從第一個內存插槽開始,對於RDRAM,還要注意內存終結板的使用)。如果故障消失,則為是內存故障,否則是主板或CPU有問題。如果POST卡的顯示與主板相關,那麼更換主板,如果故障不能消失,則為CPU有問題。如果POST卡顯示與CPU相關,那麼需要用萬用表檢查主板向CPU供電電壓是否超出范圍,超出則說明CPU和主板可能同時損壞了。沒有超出,那麼就更換CPU;如果故障還不消失,那麼就是主板出現問題了。

開機有顯示但自檢報錯或死機情況的解決辦法:

(1)要檢查故障是否是在更換或者是添加新的硬體之後發生的,如果把是就換原來的硬體,檢查新硬體的質量、技術規格是否適用,檢查插槽、插座等是否良好。或者看屏幕上顯示的內容是束與實際硬體配置相符,如果都是正常的,就需要修改BLOS中的參數或者升級相應的BLOS。

(2)接著認真看自檢死機時的位置。根據死機的不同位置,檢查內存或者硬碟故障。

若出現反復重啟或斷電情況的故障現象,使用最小系統方法,看是否出現死機或者反復重啟。如果沒有,那麼說明是其他部件引起的故障,最後通過先換主板再換CPU確定發生故障的部件。

4、供電配件不正常類故障

產生時鍾不準,或CMOS掉電,或不能進入BLOS,或不能更新BLOS,或主機外殼金屬部分麻手等故障。

解決方法:產生時鍾不準,CMOS掉電的故障一般是由於主板CMOS電池電量不足造成的,在環境檢查中應該就能解決,產生這個故障還有可能的原因是系統中有影響時鍾的程序正在運行或相關服務被啟動了,查看相應的操作系統是否存在有關的BUG,如果有,將相應的程序或者服務關閉。再給操作系統打上補丁程序就行了。如果還不能解決問題,則需要更換主板。如果產生不能進入或都更新BLOS,按照主板、內存、CPU的順序進行替換檢查。

如果主機外殼金屬部分麻手,那麼首先檢查系統是否接有地線,如果沒有接地線,說明這個不是故障。同時強烈建議在使用電腦的時候安裝地線。接著用萬用表檢查市電插座的地線是否零線短接了,如果是,則斷開零線與地線的連接,最後更換電源。若故障減輕了,則說明有漏電現象。

5、硬體系統不穩定類故障

出現了不能正常啟動,不能啟動,或能啟動,但是有錯誤,或經常重新啟動等故障。

解決方法:對於不同的情況,我們有不同的解決方法。如果是在更換了硬體之後引起的不能正常啟動的故障,首先需要確認BLOS中的BOOTEASY是禁止的,防寫開關是關閉的(在完成一次正常啟動過程以後再恢復原狀)。接著檢查新更換的硬體設置及連接電纜甚至本身是否有錯,或者是否與默認值不匹配。

如果出現了不能啟動的情況,先聽磁碟驅動器聲音是否異常,再根據磁碟類的故障進行判斷修正。如果不是磁碟故障,那麼通過更換主板檢查是否是主板的故障。

如果在啟動的進修出現死機或者報錯,應該使電腦運行在最小軟體系統下。如果故障得以解決,則通過逐步添加的方法確定故障的系統軟體部分。這里需要注意的是對於接有SCSI設備的計算機要關注啟動時的順序。如果在軟體最小系統下不能啟動,則看能否用其他的驅動器,比如軟碟機或者光碟機啟動。這里推薦使用希捷的硬碟檢測軟盤來啟動。如果能,則檢查能否訪問用於啟動的硬碟分區,再進行病毒查殺,查看啟動分區是否被激活,啟動文件是否損壞了,然後進行必要的修復。

如果不能進行上面的操作,剛按照磁碟檢測類故障進行排除。如果啟動過程中提示下列錯誤信息Invalid partition Table或者DISK BOOT FAILURE ,INSERT SYSTEM DISK AND PRESS ENTER或者Non System disk or disk error 或是Missing Operating System或者 NTLDR錯誤等,先查殺病毒,排除病毒因素,然後檢查硬碟是否已經正確分區,磁碟的參數是否正確。這需要在BLOS中設定正確的參數,並用干凈的啟動盤啟動並正確分區,接著檢查硬碟的啟動分區是否格式化,是否被激活,是否有啟動文件,並保證啟動文件的完整,沒有被破壞。如果不能實現上面步驟,再檢查系統是否工作在超頻狀態下或者是頻率過低狀態下。如果上面條件都滿足還不行,則說明是磁碟故障。

如果是不能從光碟機或者軟碟機中啟動,則需要檢查BLOS中啟動順序項,搓問及此事按磁碟類故障中的環境檢查方法檢查,然後在軟體最小系統下,用光碟機或軟碟機替代硬碟。接下來在可以啟動的情況逐個添加其他的驅動器,找出聘書現故障的部件,這里需要注意的是要看系統中是否有第三方磁碟管理程序。如果不能啟動則需要更換電源或者主板。

計算機能夠啟動,但是時常有錯誤發生。出現這個故障,一般有以下幾種情形:

(1)啟動過程中總是進行磁碟掃描或其他不該有的固定操作。產生這種故障,先檢查系統中有沒有病毒或者其他後門程序,檢查啟動組中是否加有經常啟動的程序或者注冊表中RUN鍵中常啟動的值,這需要查殺病毒和關閉一些不必要的啟動項。最後檢查系統中是否加油硬碟保護卡或者系統安裝了附加的磁碟管理或控製程序。如果有,先去掉保護功能,完成正常啟動後再加上保護功能或者卸載掉相關的程序或者設置。

(2)系統只能進入安全模式。先查看啟動中是否提示某個或某些文件錯誤或丟失。出現這種情況,對於Windows 2000/XP,選擇「上一次啟動」來檢查可否正查功能啟動。總的來說,由於操作系統的原因產生的故障一般通過重新安裝操作系統就能解決。

(3)啟動時非常慢。排除操作系統及其他軟體的原因,確認BLOS中的CPU緩存項是打開的,接著按照磁碟類的故障檢測方法進行判斷。接著檢查CPU風扇的運轉是否正常,注意保證CPU良好散熱。再次用內存檢查程序檢查內存是否有故障,最後用萬用表檢查電源的負載能力,必要的時候需要更換內存和電源。

6、硬碟類故障

硬碟不能正確識別,或硬碟聲音異常,或硬碟正常使用但硬碟燈常亮,或不能分區、格式化、或讀寫硬碟數據有錯誤或死機,或常提示數據錯誤,或經常性死機,或盤符丟失、被更改等。

解決方法:如果遇見硬碟驅動器不能正確識別的故障,先看硬碟是否接在外加的硬碟控制卡上(如RAID卡等),如果是,將硬碟直接接在主板的硬碟介面上檢查,若故障消失,則說明是久中板卡或擴展槽的故障。接著在軟體最小系統下檢查故障是否消失,如果消失通過逐個添加的方法判斷引起故障原因。接著看在BLOS下或自檢的時候能否識別指定的硬碟驅動器,如果能則需要保證在BLOS下其有正確的參數,不是正確參數,通過清除BLOS數據恢復出廠設置。如果不能自動識別硬碟,則查看主機中的硬碟燈是否常亮,能亮則檢查硬碟上的跳線設置與連接在數據線上的位置是否匹配,保證跳線設置的准確,接著檢查數據線是否接錯或者接反,然後更換數據線檢查是否是數據線有故障,確保數據線沒有故障。

如果出現硬碟聲音異常的現象,先將驅動器拿出機箱,排除驅動器與機箱配合不當造成的故障,然後用萬用表檢查電源的供電能力是否不足或者是輸出電壓不在允許的范圍內。接著檢查硬碟的技術標准主板能否支持,如果不支持,則需要更新主板BLOS版本看能否解決問題。如果還不能解決,則兩者不能兼容,需要更換硬碟或者主板。

如果硬碟能正常使用,但是硬碟燈常亮,先檢查是否在同一電纜線上連接了兩個驅動器,再檢查它們的跳線是否有沖突,然後看操作系統是否啟動了不恰當的服務或都是發生了注冊表錯誤,關閉那些服務或者能過備份的注冊表恢復注冊表。

對於其他幾種故障,先按照「不能正確識別硬碟」故障的解決順序進行判斷。接著用相應廠商的硬碟是否有壞道。如果硬碟壞道較多,則需要更換硬碟或是相應的介質。確保數據線與驅動器支持的技術規范是匹配的,接下來檢查並保證系統沒有超階級頻,是在正確的工作頻率下使用的,然後通過軟體系統最小法來確定故障源。接下來清除BLOS,恢復出廠設置,保證硬碟沒有病毒。查看操作系統中的設備管理器中有關磁碟通道的設置是否不恰當。看操作系統中是否載入了第三方的磁碟管理軟體,比如說PQManager、虛擬光碟機等軟體,只要卸載它們就行了。在操作系統中卸載相應的驅動器,重新搜索安裝驅動程序。還有可能是使用了 Ghost之類的軟體進行了數據對拷而引起硬碟的工作不正常。最後使用內存檢測程序判斷是否由於內存模塊引起的磁碟系統工作不正常。

7、顯示器顯示類故障

開機無顯示,或顯示器偏色、或顯示器出現抖動、滾動、閃爍情況,或顯示器顯示有條紋、花屏、重影、模糊,或休眠後顯示異常,或間隙性黑屏等顯示器類故障。

解決方法:在開機無顯示的情況下,先進行環境檢查,保證顯示器正常通電。如果保證其正常通電,而指示燈不亮,說明是顯示器本身的故障。如果能加電,但是不能顯示,而指示燈顏色正常,則是顯示器故障,然後檢查顯示器信號線的針是否有彎曲或者折斷了的,保證信號線與顯卡介面沒有接觸不良的現象。如果主機上有一個以上的顯示介面保證顯示器接在正確的顯示介面上。重新啟動電腦,看能否聽見主機正常自檢與啟動的聲音。如果能,則清除CMOS,或者更改「Init Display First」值,看能否解決問題。如果顯示器出現了亮一下就來的情況,則先確保BLOS中的BOOTEASY項功能關閉,然後更換顯卡,主板等檢查,故障依舊,則說明是顯示器的問題。

如果顯示器顯示不正常,比如出現偏色、抖動、花屏、重影、模糊等,先看是否是自己無意設置了一個不規范的值,看能否用手動調回。然後通過消磁看能否解決故障,檢查顯示器信號線的插針是否有彎曲或者折斷的現象。保證與顯卡的良好接觸,還要保證顯卡與主板的良好接觸,看顯示器周圍是否有大幹擾源,比如說大的音箱、微波爐等。如果有較多的顯示器放在一起,而且間距過小,也會造成這種故障。檢查市面上電是否穩定,主要是頻率,接觸是否良好,如果不穩定,還需要採取必要的措施,比如穩頻來進行改進。還有出現花屏等故障是由於主板或者顯卡的驅動程序沒有正常安裝。

上面就電腦使用過程中可能遇見的各種故障給出的一些診斷方法和排除方法,主要涉及計算機的顯示器、硬碟、主板、CPU、電源等。還有一些硬體,比如軟碟機或者光碟機出現故障多是由於碟片本身的質量造成磁碟錯誤或者是由於驅動器的磁頭老化造成的故障。而其餘的硬體,比如鍵盤、滑鼠、音頻設備等出現故障多是由於連接線的斷接造成的。通過最小系統的方法就能最小劃分故障范圍,確定出現故障的部件,然後使用萬用表等工具確定簡單的短路、斷路引起的故障。

㈡ NAS存儲故障導致Linux不能正常啟動該如何處理

一、故障現象描述

NAS操作系統內核為Linux,自帶的存儲有16塊硬碟,總共分兩組,每組做了RAID5,Linux操作系統無法正常啟動,在服務啟動到cups那裡就停止了,按鍵ctrl+c強制斷開也沒有響應,查看硬碟狀態,都是正常的,沒有報警或者警告現象。

二、問題判斷思路

通過上面這些現象,首先判斷NAS硬體應該沒問題,NAS存儲盤也應該正常,現在Linux無法啟動,應該是Linux系統本身存在問題,因此,首先從Linux系統入手進行排查。

三、問題處理過程

1、第一次處理過程

NAS系統本身就是一個Linux內核裝載了一個文件系統管理軟體,管理軟體可以對系統磁碟、系統服務、文件系統等進行管理和操作,正常情況下,基於Linux內核的NAS系統應該啟動到init3或者init5模式下,由於NAS僅用了Linux一個內核模塊和幾個簡單服務,所以判斷NAS下的Linux系統肯定是啟動到init 3模式下,那麼現在無法啟動到多用戶字元界面下,何不讓Linux直接進入單用戶(init 1)模式下呢,因為單用戶模式下僅僅啟用系統所必須的幾個服務,而cpus服務是應用程序級別的,肯定不會在「init 1」模式下啟動,這樣就避開了cups無法啟動的問題,所以,下面的工作就是要進入Linux的單用戶模式下。

很多的Linux發行版本都可以在啟動的引導界面通過相關的設置進入單用戶模式下,通過查看NAS的啟動過程,基本判斷這個Linux系統與RHEL/Centos發行版極為類似,因此,就通過RHEL/Centos進入單用戶模式的方法試一試。

RHEL/Centos進入單用戶模式很簡單,就是在系統啟動到引導歡迎界面下,按鍵e,然後編輯正確的內核引導選項,在最後面加上「single」選項,最後直接按鍵「b「即可進入單用戶了。

接下來,重新啟動NAS,然後硬體自檢,接著開始啟動Linux,一直在等待這個NAS的啟動歡迎界面,但是歡迎界面一直沒出來,就直接進入內核鏡像,載入內核階段了,沒有內核引導界面,如何進入單用戶啊,經過簡單思考,還是決定在硬體檢測完畢後直接按鍵盤」e「鍵,奇跡出現了,還真的可以,NAS進入到了內核引導界面,通過簡單觀察,發行第二個正是要引導的內核選項,於是移動鍵盤上下鍵,選擇這個內核,然後在按鍵」e「,進入內核引導編輯界面了,在這行的最後面,輸入「single」,然後按回車鍵,返回上個界面,接著按鍵「b」開始進行單用戶引導,經過一分鍾的時間,系統如願以償的進入了單用戶下的shell命令行。

進入單用戶模式後,能做的事情就很多了,首先要做的就是將cups服務在多用戶模式下自啟動關閉,執行命令如下:

chkconfig --levle 35 cups off

執行成功後,重啟系統進入多用戶模式下,看看系統是否能正常啟動。

2、第二次處理過程

將cups服務開機自啟動關閉後,重啟NAS,發現問題依舊,NAS還是啟動到cups服務那裡停止了,難道上面的命令沒有執行成功嗎?明明已經禁止了cups服務啟動了,怎麼還是啟動了呢?於是,繼續重啟NAS,再次進入單用戶模式下,看看問題究竟出在哪裡了。

進入單用戶後,再次執行chkconfig 命令,依舊可以成功,難道是cups服務有問題,先看看配置文件,執行如下命令:

vi /etc/cups/cupsd.conf

在這里發現了一個問題,vi打開cupsd.conf時,提示「write file in swap」,文件明明真實存在,怎麼說在虛擬內存中呢,經過思考,只有一種可能,NAS設備的Linux系統分區應該沒有正確掛載,導致在進入單用戶的時候,所有文件都存儲在了虛擬內存中,要驗證非常簡單,執行「df」命令查看即可,如下圖所示:

到這里為止,發現問題了。/dev/sda2磁碟分區已經沒有可用的磁碟空間了,而這個分區剛好是NAS系統的根分區,根分區沒有空間了,那麼系統啟動肯定就出問題了。

下面再把思路轉到前面介紹的案例中,由於系統cups服務在啟動的時候會寫啟動日誌到根分區,而根分區因為沒有空間了,所以也就無法寫日誌了,由此導致的結果就是cups服務無法啟動,這就解釋了此案例中NAS系統每次啟動到cups服務就停止的原因。

四解決問題

由於NAS系統只有根分區和/boot分區,所以系統產生的相關日誌都會存儲在根分區中,現在根分區滿了,首先可以清理的就是/var目錄下的系統相關日誌文件,通常可以清理的目錄有/var/log,執行如下命令查看/var/log日誌目錄占據磁碟空間大小:

[root@NASserver ~]# -sh /var/log

50.1G /var/log

通過命令輸出發現/var/log目錄占據了根分區僅70%的空間,清理這個目錄下的日誌文件即可釋放大部分根分區空間,清理完畢,重啟NAS系統,發現系統cups服務能正常啟動了,NAS服務也啟動正常了。

熱點內容
ftp的服務系統主要包括什麼 發布:2025-02-03 21:41:33 瀏覽:303
換汽車壓縮機 發布:2025-02-03 21:38:10 瀏覽:65
安卓版的迷你世界怎麼登錄 發布:2025-02-03 21:28:05 瀏覽:585
dt如何編譯 發布:2025-02-03 21:16:59 瀏覽:563
unity調用腳本 發布:2025-02-03 21:13:21 瀏覽:267
php方法類 發布:2025-02-03 21:01:56 瀏覽:443
電腦基岩版材質包怎麼安裝到伺服器里 發布:2025-02-03 20:57:33 瀏覽:390
linux文件組 發布:2025-02-03 20:53:51 瀏覽:329
db2存儲執行變慢 發布:2025-02-03 20:42:21 瀏覽:766
滑板鞋腳本視頻 發布:2025-02-02 09:48:54 瀏覽:433