看門狗源碼
1. 快速學習單片機編程的方法
單片機匯編語言編程規范
軟體設計更多地是一種工程,而不是一種個人藝術。如果不統一編程規范,最終寫出的程序,其可讀性將較差,這
不僅給代碼的理解帶來障礙,增加維護階段的工作量,同時不規范的代碼隱含錯誤的可能性也比較大。分析表明,編碼
階段產生的錯誤當中,語法錯誤大概佔20%左右,而由於未嚴格檢查軟體邏輯導致的錯誤、函數(模塊)之間介面錯誤
及由於代碼可理解度低導致優化維護階段對代碼的錯誤修改引起的錯誤則佔了一半以上。可見,提高軟體質量必須降低
編碼階段的錯誤率。如何有效降低編碼階段的錯誤呢?這需要制定詳細的軟體編程規范,並培訓每一位程序員,最終的
結果可以把編碼階段的錯誤降至10%左右,同時也降低了程序的測試費用,效果相當顯著。
本文從代碼的可維護性(可讀性、可理解性、可修改性)、代碼邏輯與效率、函數(模塊)介面、可測試性四個方
面闡述了軟體編程規范,規范分成規則和建議兩種,其中規則部分為強制執行項目,而建議部分則不作強制,可根據習
慣取捨。
1.排版
規則 1
程序塊使用縮進方式,函數和標號使用空格縮進,程序段混合使用TAB 和空格縮進。縮進的目的是使程序結構清晰,便
於閱讀和理解。
<TAB>默認寬度應為8 個空格,由於Word 中<TAB>為4 個空格,為示範清晰,此處用2 個<TAB>代替(下同)。
例如:
MOV R1, #00H
MOV R2, #00H
MOV PMR, #PMRNORMAL
MOV DPS, #FLAGDPTR
MOV DPTR, #ADDREEPROM
read1kloop:
read1kpage:
INC R1
MOVX A, @DPTR
MOV SBUF, A
JNB TI, $
CLR TI
INC DPTR
CJNE R1, #20H, read1kpage
INC R2
MOV R1, #00H
CPL WDI
CJNE R2, #20H, read1kloop ;END OF EEPROM
規則2
在指令的操作數之間的,使用空格進行間隔,採用這種鬆散方式編寫代碼的目的是使代碼更加清晰。
例如:
CJNE R2, #20H, read1kloop ;END OF EEPROM
規則 3
一行最多寫一條語句。
規則 4
變數定義時,保持對齊。便於閱讀和檢查內存的使用情況。
例如:
RegLEDLOSS EQU 30H ; VARIABLE ;
TESTLED==RegLEDLOSS.0
RegLEDRA EQU 31H ; VARIABLE
RUNLED_Flag EQU 32H ; VARIABLE ;
256ms 改變一次RUNLED 狀態
RUNLED_Def EQU 10H ; STATIC ;
16*32ms=500ms 改變一次LED 狀態
2.注釋
注釋的原則是有助於對程序的閱讀理解,注釋不宜太多也不能太少,太少不利於代碼理解,太多則會對閱讀產生干擾,
因此只在必要的地方才加註釋,而且注釋要准確、易懂、盡可能簡潔。注釋量一般控制在30%到50%之間。
規則 1
程序在必要的地方必須有注釋,注釋要准確、易懂、簡潔。
例如如下注釋意義不大:
MOV DXCE1COUNTER, #00H ; 將DXCE1COUNTER 賦值為0
而如下的注釋則給出了額外有用的信息:
JNZ PcComm_Err ; 假如校驗出錯
規則 2
注釋應與其描述的代碼相近,對代碼的注釋應放在其上方或右方(對單條語句的注釋)相鄰位置,不可放在下面,如放
於上方則需與其上面的代碼用空行隔開。
規則 3
頭文件、源文件的頭部,應進行注釋。注釋必須列出:文件名、作者、目的、功能、修改日誌等。
規則 4
函數頭部應進行注釋,列出:函數的目的、功能、輸入參數、輸出參數、涉及到的通用變數和寄存器、調用的其他函數
和模塊、修改日誌等。對一些復雜的函數,在注釋中最好提供典型用法。
規則 5
對重要代碼段的功能、意圖進行注釋,提供有用的、額外的信息。並在該代碼段的結束處加一行注釋表示該段代碼結束。
規則 6
對於所有的常量,變數,數據結構聲明(包括數組、結構、類、枚舉等),如果其命名不是充分自注釋的,在聲明時都必
須加以注釋,說明其含義。
規則 7
維護代碼時,要更新相應的注釋,刪除不再有用的注釋。保持代碼、注釋的一致性,避免產生誤解。
3.命名
規則 1
標識符縮寫
形成縮寫的幾種技術:
1) 去掉所有的不在詞頭的母音字母。如screen 寫成scrn, primtive 寫成prmv。
2) 使用每個單詞的頭一個或幾個字母。如Channel Activation 寫成ChanActiv,ReleaseIndication 寫成RelInd。
3) 使用變數名中每個有典型意義的單詞。如Count of Failure 寫成FailCnt。
4) 去掉無用的單詞後綴 ing, ed 等。如Paging Request 寫成PagReq。
5) 使用標準的或慣用的縮寫形式(包括協議文件中出現的縮寫形式)。
如 BSIC(Base Station Identification Code)、MAP(Mobile Application Part)。
關於縮寫的准則:
1) 縮寫應該保持一致性。如Channel 不要有時縮寫成Chan,有時縮寫成C
h。Length 有時縮寫成Len,有時縮寫成len。
2) 在源代碼頭部加入註解來說明協議相關的、非通用縮寫。
3) 標識符的長度不超過12 個字元。
規則 2
變數命名約定:<前綴> + 主體 ; 注釋
變數命名要考慮簡單、直觀、不易混淆。
前綴是可選項,表示變數類型,由於匯編中變數多是單位元組變數,所以單位元組變數可以不加前綴,對於 bit 和雙位元組型
變數,使用小寫的b 和d 作為前綴表示。
主體是必選項,可多個單詞(或縮寫)合在一起,每個單詞首字母大寫,其餘部分小寫。
規則 3
常量的命名
常量的命名規則:單詞的字母全部大寫,各單詞之間用下劃線隔開。
規則 4
函數的命名
單詞首字母為大寫,其餘均為小寫。函數名應以一個動詞開頭,即函數名應類似一個動詞斷語或祈使句。
例如:Test_Protect, Check_EEPROM, Init_Para
4.可維護性
規則 1
函數和過程中關系較為緊密的代碼盡可能相鄰。
規則 2
每個函數的源程序行數原則上應該少於200 行。對於消息分流處理函數,完成的功能統一,但由於消息的種類多,可能
超過200 行的限制,不屬於違反規定。
規則 3
語句嵌套層次不得超過5 層。嵌套層次太多,增加了代碼的復雜度及測試的難度,容易出錯,增加代碼維護的難度。
規則 4
避免相同的代碼段在多個地方出現。當某段代碼需在不同的地方重復使用時,應根據代碼段的規模大小使用函數調用或
宏調用的方式代替。這樣,對該代碼段的修改就可在一處完成,增強代碼的可維護性。
規則 5
每個函數完成單一的功能,不設計多用途面面俱到的函數。多功能集於一身的函數,很可能使函數的理解、測試、維護
等變得困難。使函數功能明確化,增加程序可讀性,亦可方便維護、測試。
規則 6
在函數的項目維護文檔中,應該指出軟體適用的硬體平台及版本。
建議 1
使用專門的初始化函數對所有的公共變數進行初始化。
5.程序正確性、效率
規則 1
嚴禁使用未經初始化的變數。引用未經初始化的變數可能會產生不可預知的後果,特別是引用未經初始化的指針經常會
導致系統崩潰,需特別注意。
規則 2
防止內存操作越界。
說明:內存操作越界是軟體系統主要錯誤之一,後果往往非常嚴重。
規則 3
注意變數的有效取值范圍,防止表達式出現上溢或下溢。
規則 4
防止易混淆的指令和操作數拼寫錯誤。
規則 5
避免函數中不必要語句,防止程序中的垃圾代碼,預留代碼應以注釋的方式出現。程序中的垃圾代碼不僅佔用額外的空
間,而且還常常影響程序的功能與性能,很可能給程序的測試、維護等造成不必要的麻煩。
規則 6
通過對系統數據結構的劃分與組織的改進,以及對程序演算法的優化來提高空間效率。這種方式是解決軟體空間效率的根
本辦法。
規則 7
循環體內工作量最小化。應仔細考慮循環體內的語句是否可以放在循環體之外,使循環體內工作量最小,從而提高程序
的時間效率。
規則 8
在多重循環中,應將最忙的循環放在最內層。
規則 9
避免循環體內含判斷語句,將與循環變數無關的判斷語句移到循環體外。目的是減少判斷次數。循環體中的判斷語句是
否可以移到循環體外,要視程序的具體情況而言,一般情況,與循環變數無關的判斷語句可以移到循環體外,而有關的
則不可以。
規則 10
中斷和恢復
中斷程序應該盡量短,應該在中斷中進行標記,在主程序中處理。但實時性很高的程序段例外。
中斷時應該保存所有涉及到的通用變數和寄存器,如 A, PSW, DPTR 等。
規則 11
堆棧設置
堆棧對於程序非常重要,對於堆棧的設置要合理。堆棧太小,在嵌套調用和容易溢出,造成系統故障;堆棧太大,浪費
RAM 資源。為了節約堆棧資源,中斷時要求不要保存太多資源,中斷嵌套和程序嵌套層數不要太多,盡量不要超過5
層。這就要求合理的劃分功能模塊。
規則 12
看門狗
看門狗電路用於在單片機死機時自動復位。單片機需要定時向看門狗發送脈沖,俗稱」喂狗」。喂狗不可太勤,這樣看門
狗沒有起到作用;也不可太慢,這樣容易造成單片機復位。正確的喂狗應該在主循環中進行,最好是建立一個獨立的系
統監控進程。不可以在定時中斷中喂狗,應為單片機有時可能會在主循環中死掉。
6.介面
規則 1
去掉沒有必要的公共變數,編程時應盡量少用公共變數。公共變數是增大模塊間耦合的原因之一,故應減少沒必要的公
共變數以降低模塊間的耦合度。應該構造僅有一個模塊或函數可以修改、創建,而其餘有關模塊或函數只訪問的公共變
量,防止多個不同模塊或函數都可以修改、創建同一公共變數的現象。
規則 2
當向公共變數傳遞數據時,要防止越界現象發生。對公共變數賦值時,若有必要應進行合法性檢查,以提高代碼的可靠
性、穩定性。
規則 3
盡量不設計多參數函數,將不使用的參數從介面中去掉,降低介面復雜度,減少函數間介面的復雜度。
規則 4
對所調用函數的返回碼要仔細、全面地處理。防止把錯誤傳遞到後面的處理流程。如有意不檢查其返回碼,應明確指明。
規則5
檢查介面函數所有輸入參數的有效性。
規則 6
檢查函數的所有非參數輸入,如外部數據、公共變數等。
7.代碼可測性
規則 1
模塊編寫應該有完善的測試方面的考慮。
規則 2
源代碼中應該設計了代碼測試的內容。
在編寫代碼之前,應預先設計好程序調試與測試的方法和手段,並設計好各種調測開關及相應測試代碼。程序的調試與
測試是軟體生存周期中很重要的一個階段,如何對軟體進行較全面、高率的測試並盡可能地找出軟體中的錯誤就成為很
關鍵的問題。因此在編寫源代碼之前,除了要有一套比較完善的測試計劃外,還應設計出一系列代碼測試手段,為單元
測試、集成測試及系統聯調提供方便。
規則 3
在同一項目組或產品組內,要有一套統一的為集成測試與系統聯調准備的調測開關及相應函數,並且要有詳細的說明。
本規則是針對項目組或產品組的。
規則 4
在同一項目組或產品組內,調測列印出的信息串的格式要有統一的形式。信息串中至少要有所在模塊名(或源文件名)
及行號。統一的調測信息格式便於集成測試。
規則 5
正式軟體產品中應把調測代碼去掉(即把有關的調測開關關掉)。
規則 6
用調測開關來切換軟體的DEBUG 版和正式版,而不要同時存在正式版本和DEBUG 版本的不同源文件,以減少維護的
難度。
規則 7
在軟體系統中設置與取消有關測試手段,不能對軟體實現的功能等產生影響。即有測試代碼的軟體和關掉測試代碼的軟
件,在功能行為上應一致。
規則 8
發現錯誤應該立即修改,並且若有必要記錄下來。
規則 9
開發人員應堅持對代碼進行徹底的測試(單元測試),而不依靠他人或測試組來發現問題。
規則 10
清理、整理或優化後的代碼要經過審查及測試。
規則 11
代碼版本升級要經過嚴格測試。
8.代碼編譯
規則 1
打開編譯器的所有告警開關對程序進行編譯。防止隱藏可能是錯誤的告警。
規則 2
某些語句經編譯後產生告警,但如果你認為它是正確的,那麼應通過某種手段去掉告警信息。照著規范系統的學習,不久的將來你也是個高手了。
2. mplab x ide匯編配置位源代碼復制到哪裡
在講基於MPLAB X IDE 配置位配置前我先講講如何配置配置位。
比如PICLF1823的數據手冊 可以再器件配置中找到兩個寄存器。一個是配置字1 ,一個是配置字2.
對於初學者來說如此多的配置選項,該如何配置呢?我們要抓主重點。
配置字中最重要的配置選項就是:
看門狗配置 如:WDTE<1;0>; 一般選擇關閉看門狗
MCLRE復位腳的配置 如:MCLRE;一般選擇復位腳作I/O
震盪器的選擇: 如:FOSC<2:0>;根據實際情況配置,我這里一般選擇用 INTOSC 內部振盪器.
因為如果這三個沒有配置好的話程序根本無法運行。其他配置可以看數據手冊此不贅述。
MPLAB X IDE和MPLAB IDE 8不同。
MPLAB IDE 8 可以再界限中選擇配置位就行。配置選項可以不寫在代碼中。
MPLAB X IDE 如果要配置的話必須在代碼中寫出配置。
實例介紹:
1.打開MPLAB X IDE 在菜單欄中 點擊Window->PIC Memory Veiws->Configuration bits
2 在出現的Configuration Bits中的改變每個配置中的option選項,紅色的就是我們改變過的配置選項
3 配置完成後 點擊 Genarate Source Code to Output 產生配置源代碼。
將其中的 __CONFIG(FOSC_INTOSC & WDTE_OFF & PWRTE_ON & MCLRE_OFF & CP_ON & CPD_ON & BOREN_ON & CLKOUTEN_OFF & IESO_ON & FCMEN_ON);
__CONFIG(WRT_OFF & PLLEN_OFF & STVREN_ON & BORV_LO & LVP_OFF);復制到源代碼中去。源代碼中必須包涵頭文件#include<pic.h>.
此處我指出一出MPLAB X IDEv1.10 的一處錯誤 在配置中的 BORV_LO 這個配置編譯器是不認的,這可能是編寫軟體的程序員和編寫頭文件的程序猿沒有配合好:
編譯器只認得頭文件,在pic16f1823.h這個頭文件中沒有定義BORV_LO 而是把他定義為BORV_19.把BORV_HI定義成BORV_25. 總之把BORV_LO修改成BORV_19就行了。
下面應網友的要求對16F877A的配置位進行講解:
CP :程序區保護 該位置1將開啟 。(這個位是必須開啟的以防止程序被讀取)
DEBUG: 使能調試功能。如果不使能RB6 RB7腳作為普通的I/O口(根據需求)
WRT1:WRT0:防寫位。防止程序區被意外寫入。(一般建議開啟)
CPD:EEPROM保護,(這個位必須開啟以防止EEPROM中的數據被讀取)
LVP:低電壓編程使能位。如果不使用低電壓編程 RB3將做普通I/O.MCLR必須用於編程。(根據需求)
BOREN:掉電檢測。掉電檢測的作用是單片機發現電壓不足的時候會及時的停止工作。防止一些意外操作的發生。比如 EEPROM 或者FLASH中的數據丟失(這個一般必須開啟防止丟碼)
PWRTEN:上電延時。開啟後單片機會延時72MS開始工作。保證上電後電路穩定後單片機才開始工作。不要求單片機一上電就馬上工作,這個位建議開啟。(建議開啟)
WDTEN:看門狗。 這個位根據你自己需要吧。開啟之後程序必須 不停的喂狗。喂不好程序就會復位。(根據需求)
FOSC1:FOSC0:振盪器選擇位。如果你用高速的就選擇HS.中速度的就用XT,希望速度低功耗低就用LP。希望用便宜且對精度要求不高的振盪器就用RC。(根據需求選擇)
20MHz~4MHz (包括4MHz)的石英晶振配置HS.
4MHz(包括4MHz)~200KHz(包括200KHz) 的石英晶振配置XT.
200KHz(包括200KHz)~32KHz的石英晶振配置LP.
RC 就是 電阻加電容。就可以做出一個便宜但精度不高的是振盪器了。
3. 如何linux內核報告問題
Linux Kernel BUG:soft lockup CPU#1 stuck分析
1.線上內核bug日誌
kernel: Deltaway too big! 18428729675200069867 ts=18446743954022816244 write stamp =18014278822746377
kernel:------------[ cut here ]------------
kernel:WARNING: at kernel/trace/ring_buffer.c:1988 rb_reserve_next_event+0x2ce/0x370()(Not tainted)
kernel:Hardware name: ProLiant DL360 G7
kernel:Moles linked in: fuse ipv6 power_meter bnx2 sg microcode serio_raw iTCO_wdtiTCO_vendor_support hpilo hpwdt i7core_edac edac_core shpchp ext4 mbcache jbd2sd_mod crc_t10dif hpsa radeon ttm drm_kms_helper drm i2c_algo_bit i2c_coredm_mirror dm_region_hash dm_log dm_mod [last unloaded: scsi_wait_scan]
kernel: Pid:5483, comm: master Not tainted 2.6.32-220.el6.x86_64 #1
kernel: CallTrace:
kernel:[<ffffffff81069b77>] ? warn_slowpath_common+0x87/0xc0
kernel:[<ffffffff81069bca>] ? warn_slowpath_null+0x1a/0x20
kernel:[<ffffffff810ea8ae>] ? rb_reserve_next_event+0x2ce/0x370
kernel:[<ffffffff810eab02>] ? ring_buffer_lock_reserve+0xa2/0x160
kernel:[<ffffffff810ec97c>] ? trace_buffer_lock_reserve+0x2c/0x70
kernel:[<ffffffff810ecb16>] ? trace_current_buffer_lock_reserve+0x16/0x20
kernel:[<ffffffff8107ae1e>] ? ftrace_raw_event_hrtimer_cancel+0x4e/0xb0
kernel:[<ffffffff81095e7a>] ? hrtimer_try_to_cancel+0xba/0xd0
kernel:[<ffffffff8106f634>] ? do_setitimer+0xd4/0x220
kernel:[<ffffffff8106f88a>] ? alarm_setitimer+0x3a/0x60
kernel:[<ffffffff8107c27e>] ? sys_alarm+0xe/0x20
kernel:[<ffffffff8100b308>] ? tracesys+0xd9/0xde
kernel: ---[end trace 4d0a1ef2e62cb1a2 ]---
abrt-mp-oops: Reported 1 kernel oopses to Abrt
kernel: BUG: softlockup - CPU#11 stuck for 4278190091s! [qmgr:5492]
kernel:Moles linked in: fuse ipv6 power_meter bnx2 sg microcode serio_raw iTCO_wdtiTCO_vendor_support hpilo hpwdt i7core_edac edac_core shpchp ext4 mbcache jbd2sd_mod crc_t10dif hpsa radeon ttm drm_kms_helper drm i2c_algo_bit i2c_coredm_mirror dm_region_hash dm_log dm_mod [last unloaded: scsi_wait_scan]
kernel: CPU 11
kernel:Moles linked in: fuse ipv6 power_meter bnx2 sg microcode serio_raw iTCO_wdtiTCO_vendor_support hpilo hpwdt i7core_edac edac_core shpchp ext4 mbcache jbd2sd_mod crc_t10dif hpsa radeon ttm drm_kms_helper drm i2c_algo_bit i2c_coredm_mirror dm_region_hash dm_log dm_mod [last unloaded: scsi_wait_scan]
kernel:
kernel: Pid:5492, comm: qmgr Tainted: G W ---------------- 2.6.32-220.el6.x86_64 #1 HPProLiant DL360 G7
kernel: RIP:0010:[<ffffffff8106f730>] [<ffffffff8106f730>]do_setitimer+0x1d0/0x220
kernel: RSP:0018:ffff88080a661ef8 EFLAGS: 00000286
kernel: RAX:ffff88080b175a08 RBX: ffff88080a661f18 RCX: 0000000000000000
kernel: RDX:0000000000000000 RSI: 0000000000000082 RDI: ffff88080c8c4c40
kernel: RBP:ffffffff8100bc0e R08: 0000000000000000 R09: 0099d7270e01c3f1
kernel: R10:0000000000000000 R11: 0000000000000246 R12: ffffffff810ef9a3
kernel: R13:ffff88080a661e88 R14: 0000000000000000 R15: ffff88080a65a544
kernel: FS:00007f10b245f7c0(0000) GS:ffff88083c4a0000(0000) knlGS:0000000000000000
kernel: CS:0010 DS: 0000 ES: 0000 CR0: 000000008005003b
kernel: CR2:00007ff955977380 CR3: 000000100a80b000 CR4: 00000000000006e0
kernel: DR0:0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
kernel: DR3:0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
kernel:Process qmgr (pid: 5492, threadinfo ffff88080a660000, task ffff880809577500)
kernel: Stack:
kernel:00007f10b323def0 00007f10b248ead0 00007f10b26d0f78 00007f10b248ede0
kernel:<0> ffff88080a661f68 ffffffff8106f88a 0000000000000000 0000000000000000
kernel:<0> 000000000000014c 00000000000f423d 0000000000000000 0000000000000000
kernel: CallTrace:
kernel:[<ffffffff8106f88a>] ? alarm_setitimer+0x3a/0x60
kernel:[<ffffffff8107c27e>] ? sys_alarm+0xe/0x20
kernel:[<ffffffff8100b308>] ? tracesys+0xd9/0xde
kernel: Code:89 ef e8 74 66 02 00 83 3d 15 69 b5 00 00 75 37 49 8b 84 24 70 07 00 00 48 0508 08 00 00 66 ff 00 66 66 90 fb 66 0f 1f 44 00 00 <31> c0 e9 64 fe ff ff49 8b 84 24 68 07 00 00 48 c7 80 d0 00 00
kernel: CallTrace:
kernel:[<ffffffff8106f769>] ? do_setitimer+0x209/0x220
kernel:[<ffffffff8106f88a>] ? alarm_setitimer+0x3a/0x60
kernel:[<ffffffff8107c27e>] ? sys_alarm+0xe/0x20
kernel:[<ffffffff8100b308>] ? tracesys+0xd9/0xde
abrt-mp-oops: Reported 1 kernel oopses to Abrt
2.內核軟死鎖(soft lockup)bug原因分析
Soft lockup名稱解釋:所謂,soft lockup就是說,這個bug沒有讓系統徹底死機,但是若干個進程(或者kernel thread)被鎖死在了某個狀態(一般在內核區域),很多情況下這個是由於內核鎖的使用的問題。
Linux內核對於每一個cpu都有一個監控進程,在技術界這個叫做watchdog(看門狗)。通過ps –ef | grep watchdog能夠看見,進程名稱大概是watchdog/X(數字:cpu邏輯編號1/2/3/4之類的)。這個進程或者線程每一秒鍾運行一次,否則會睡眠和待機。這個進程運行會收集每一個cpu運行時使用數據的時間並且存放到屬於每個cpu自己的內核數據結構。在內核中有很多特定的中斷函數。這些中斷函數會調用soft lockup計數,他會使用當前的時間戳與特定(對應的)cpu的內核數據結構中保存的時間對比,如果發現當前的時間戳比對應cpu保存的時間大於設定的閥值,他就假設監測進程或看門狗線程在一個相當可觀的時間還沒有執。Cpu軟鎖為什麼會產生,是怎麼產生的?如果linux內核是經過精心設計安排的CPU調度訪問,那麼怎麼會產生cpu軟死鎖?那麼只能說由於用戶開發的或者第三方軟體引入,看我們伺服器內核panic的原因就是qmgr進程引起。因為每一個無限的循環都會一直有一個cpu的執行流程(qmgr進程示一個後台郵件的消息隊列服務進程),並且擁有一定的優先順序。Cpu調度器調度一個驅動程序來運行,如果這個驅動程序有問題並且沒有被檢測到,那麼這個驅動程序將會暫用cpu的很長時間。根據前面的描述,看門狗進程會抓住(catch)這一點並且拋出一個軟死鎖(soft lockup)錯誤。軟死鎖會掛起cpu使你的系統不可用。
如果是用戶空間的進程或線程引起的問題backtrace是不會有內容的,如果內核線程那麼在soft lockup消息中會顯示出backtrace信息。
3.根據linux內核源碼分析錯誤
根據我們第一部分內核拋出的錯誤信息和call trace(linux內核的跟蹤子系統)來分析產生的具體原因。
首先根據我們的centos版本安裝相應的linux內核源碼,具體步驟如下:
(1)下載源碼的rpm包kernel-2.6.32-220.17.1.el6.src.rpm
(2)安裝相應的依賴庫,命令:yuminstall rpm-build redhat-rpm-config asciidoc newt-devel
(3)安裝源碼包:rpm -ikernel-2.6.32-220.17.1.el6.src.rpm
(4)進入建立源碼的目錄:cd~/rpmbuild/SPECS
(5)建立生成源碼目錄:rpmbuild-bp --target=`uname -m` kernel.spec
下面開始真正的根據內核bug日誌分析源碼:
(1)第一階段內核錯誤日誌分析(時間在Dec 4 14:03:34這個階段的日誌輸出代碼分析,其實這部分代碼不會導致cpu軟死鎖,主要是第二階段錯誤日誌顯示導致cpu軟死鎖)
我們首先通過日誌定位到相關源代碼:看下面日誌:Dec 4 14:03:34 BP-YZH-1-xxxx kernel: WARNING: atkernel/trace/ring_buffer.c:1988 rb_reserve_next_event+0x2ce/0x370() (Not tainted)
根據日誌內容我們可以很容易的定位到kernel/trace/ring_buffer.c這個文件的1988行代碼如下:WARN_ON(1)。
先簡單解釋一下WARN_ON的作用:WARN_ON只是列印出當前棧信息,不會panic。所以會看到後面有一大堆的棧信息。這個宏定義如下:
#ifndef WARN_ON
#defineWARN_ON(condition) ({ \
int __ret_warn_on = !!(condition); \
if (unlikely(__ret_warn_on)) \
__WARN(); \
unlikely(__ret_warn_on); \
})
#endif
這個宏很簡單保證傳遞進來的條件值為0或者1(兩次邏輯非操作的結果),然後使用分支預測技術(保證執行概率大的分支緊鄰上面的指令)判斷是否需要調用__WARN()宏定義。如果滿足條件執行了__WARN()宏定義也接著執行一條空指令;。上面調用WARN_ON宏是傳遞的1,所以會執行__WARN()。下面繼續看一下__WARN()宏定義如下:
#define __WARN() warn_slowpath_null(__FILE__,__LINE__)
從接下來的call trace信息中我們也確實發現調用了warn_slowpath_null這個函數。通過在linux內核源代碼中搜索這個函數的實現,發現在panic.c(內核恐慌時的相關功能實現)中實現如下:
voidwarn_slowpath_null(const char *file, int line)
{
warn_slowpath_common(file, line,__builtin_return_address(0),
TAINT_WARN, NULL);
}
EXPORT_SYMBOL(warn_slowpath_null);//都出這個符號,讓其他模塊可以使用這個函數
同樣的我們看到了warn_slowpath_common這個函數,而在call trace當中這個函數在warn_slowpath_null函數之前列印出來,再次印證了這個流程是正確的。同樣在panic.c這個文件中我發現了warn_slowpath_common這個函數的實現如下:
static voidwarn_slowpath_common(const char *file, int line, void *caller,
unsigned taint, struct slowpath_args *args)
{
const char *board;
printk(KERN_WARNING "------------[ cut here]------------\n");
printk(KERN_WARNING "WARNING: at %s:%d %pS()(%s)\n",
file, line, caller, print_tainted());
board = dmi_get_system_info(DMI_PRODUCT_NAME);//得到dmi系統信息
if (board)
printk(KERN_WARNING "Hardware name:%s\n", board);//通過我們的日誌信息可以發現我們硬體名稱是ProLiant DL360 G7
if (args)
vprintk(args->fmt, args->args);
print_moles();//列印系統模塊信息
mp_stack();//mp信息輸出(call trace開始)
print_oops_end_marker();//列印oops結束
add_taint(taint);
}
分析這個函數的實現不難發現我們的很多日誌信息從這里開始輸出,包括列印一些系統信息,就不繼續深入分析了(請看代碼注釋,裡面調用相關函數列印對應信息,通過我分析這些函數的實現和我們的日誌信息完全能夠對應,其中mp_stack是與cpu體系結構相關的,我們的伺服器應該是屬於x86體系)。這里在繼續分析一下mp_stack函數的實現,因為這個是與cpu體系結構相關的,而且這個函數直接反應出導致內核panic的相關進程。這個函數實現如下:
/*
* The architecture-independent mp_stackgenerator
*/
void mp_stack(void)
{
unsigned long stack;
printk("Pid: %d, comm: %.20s %s %s %.*s\n",
current->pid, current->comm,print_tainted(),
init_utsname()->release,
(int
4. 單片機控制一個4位的共陰數碼管通電的狀態下顯示時間的程序
#include <reg52.h>
#define uint unsigned int
#define uchar unsigned char
sbit PRESS1=P1^0;
sbit PRESS2=P1^1;
sbit PRESS3=P1^2;
uint a[]={0x3f,0x06,0x5b,0x4f,0x66,0x6d,0x7d,0x07,0x7f,0x6f};//0到9
uint b[]={0xfe,0xfd,0xfb,0xf7,0xef,0xdf,0xbf,0x7f};
int miao=45,fen=58,shi=15;
uint jishu;
uint miaog,miaos,feng,fens,shig,shis;
int ji;
void init()//初始化函數設置中斷寄存器的值。
{
jishu=0;
TMOD=0x01;
TR0=1;
ET0=1;
EA=1;
TH0=0x3c;
TL0=0xb0;
}
void delay(x)//延時函數。
{
uint i,j;
for(i=x;i>0;i--)
for(j=120;j>0;j--);
}
void xian()//把時分秒送到數碼管顯示。
{
uint i;
miaog=miao%10;
miaos=miao/10;
feng=fen%10;
fens=fen/10;
shig=shi%10;
shis=shi/10;
for(i=0;i<8;i++)
{
switch(i)
{
case 0:P3=b[7];P2=a[miaog];break;
case 1:P3=b[6];P2=a[miaos];break;
case 2:P3=b[5];P2=0x40;break;
case 3:P3=b[4];P2=a[feng];break;
case 4:P3=b[3];P2=a[fens];break;
case 5:P3=b[2];P2=0x40;break;
case 6:P3=b[1];P2=a[shig];break;
case 7:P3=b[0];P2=a[shis];break;
}
delay(1);
};
}
void jiance()//檢測鍵是否按下按不同鍵實現不同的處理。
{
if(PRESS1==0)
{
delay(2);
if(PRESS1==0)
{
while(!PRESS1);
ji++;
if(ji>=4)
ji=0;
}
}
if(ji==1)
{
if(PRESS2==0)
{
delay(1);
while(!PRESS2);
miao++;
if(miao>=60)
{
miao=0;
fen++;
}
}
if(PRESS3==0)
{
delay(1);
while(!PRESS3);
miao--;
if(miao<0)
{
miao=59;
}
}
}
if(ji==2)
{
if(PRESS2==0)
{
delay(1);
while(!PRESS2);
fen++;
if(fen>=60)
{
fen=0;
shi++;
}
}
if(PRESS3==0)
{
delay(1);
while(!PRESS3);
fen--;
if(fen<0)
{
fen=59;
}
}
}
if(ji==3)
{
if(PRESS2==0)
{
delay(1);
while(!PRESS2);
shi++;
if(shi>=24)
{
shi=0;
}
}
if(PRESS3==0)
{
delay(1);
while(!PRESS3);
shi--;
if(shi<0)
{
shi=23;
}
}
}
if(ji==0)
EA=1;
else
EA=0;
}
void main()
{
init();
while(1)
{
xian();
jiance();
}
}
void an() interrupt 1 //計時中斷0工作方式1函數。
{
TH0=0x3c;
TL0=0xb0;
jishu++;
if(jishu==20)
{
jishu=0;
miao++;
if(miao==60)
{
miao=0;
fen++;
if(fen==60)
{
fen=0;
shi++;
if(shi==24)
shi=0;
}
}
}
}
5. 工業arm板,像三星6818開發板能做嗎
比較難,因為三星晶元都不是工業級的。雖然晶元未必有,但設備肯定有。
所謂工業級,是指適應一定工作環境的設備指標要求,這個要求比普通級別要苛刻。普通設備一般會放置在溫度中等濕度中等且恆定的專業機房中,對設備的適用環境的能力沒有大的要求。工業級一般應用於非機房環境中,如野外,溫差大,干擾多,灰塵大等因素,要求設備各方面參數要更好。不過因為使用環境要求不同,6818開發板也可以使用在一定的環境下。像榮品的6818開發板使用溫度就在-20℃到70℃。