c語言編譯優化
❶ 提高c語言代碼效率
C語言7種提高效率
1、位運算替代乘除
位運算是C語言中的最小數據單元,移位運算或位處理基本上是每個MCU或者處理器的指令集中直接支持的所以C代碼編譯成匯編以後基本上簡單的幾條匯編指令即可完成運算。
然而對於乘除法CPU一般無法直接運行,當然現在高端的晶元一般支持FPU等等之類的處理,相對而言速度得到了顯著提升;但是大部分還是會比移位運算處理耗時,特別是有些編譯器直接把乘除法編譯成函數調用來處理。所以像n/8這樣的處理直接使用n>>3即可替代,這樣效率會更高。
2、變數的使用
使用全局變數相對局部變數效率更高,函數的局部變數一般處於函數內部,在調用過程中存在入棧與出棧野孝的情況,這樣就增加了函數調用的耗時,而全局變數直接訪問效率更高。當然全局變數是程序中要非常小心使用的,濫用全局變數的行為確實會增加系統各模塊之間的耦合,所以在程席中要規范全局的統一介面使用。
同時對於變數類型的使用也是大家需要注意的,數據類型不是越大越好,比如uint64_t的處理匯編生成代碼就相對比較多,執行效率一般比短數據類型要低,盡量選擇晶元相同位數的數據類型處理,當然大部分更小的數據長度也是合適的。
3、指針替代數組
相對數組索引,指針運算效率更快,數組是一片連續的內存空間,那麼通過指針移動進行數組數據的索引也是合適的。
比如我們遍歷數組array[i],任意一次的循環都需要對其進行下 「i」值的標記與計算,而當指針「p」位於array數組位置的時候,循環僅只需要對「p」進行增量的操作,這樣指針耗時會比數組訪問小很多。
4、演算法優化
一些數據的處理明明可以通過更加簡潔的演算法,可是沒脊侍大部分程序員非要以最傻瓜的方式進行運算,最容易理解的就是高斯求和,1~100累加,還是選擇高斯求和演算法,當然還有很多演算法有多種形式,各有優劣,根據自身需求進行合理選擇。特別是一些應用根本沒有必要用使用高精度耗時的數據處理演算法,選擇一些低精度快速的演算法更加合適。
5、優化分支語句
我們都知道if-else語句是最常用的分支語句,其特點就是逐一判斷,既然是判斷就會消耗時間,然而對於一些處理並不是每個分支都是均勻執行的,如果你把頻繁執行的相應分支放到後面,勢必就需要執行較多前面的逐一判斷,從而降低代碼執行效率。
所以我們要對各個分支的執行頻率進行評估,把最有可能執行的放在判斷語句前面執行。同樣對於分支語句多級嵌套的情況,我們需要把頻率性對較高的放到外層,頻率低的放內層,這樣減枯吵少不必要的外層判斷。
6、循環語句的優化
在系統的多重循環過程中,需要程序員將最長的循環內容設置在系統的最內層,同時需要將最短的循環內容設置在系統的最外層。
這樣,能夠有效提升CPU的運行效率,減少循環次數。另外,如果在系統的循環過程中需要進行邏輯判斷,且循環的次數相對較大,就需要將循環判斷從系統內部轉移到系統的外部。
7、無敵」 宏"的利用
宏在C語言中是靈活度非常高的語法特性,宏代碼片段的使用其代碼表現形式上與函數差異並不是很大,大夥有學習C++語言模板的經驗,應該會覺得兩者有頗多相似之處。
在對函數進行調用的過程中,需要通過棧對其進行儲存,而且CPU在函數調用的過程中還要做好對數據的恢復准備,有效進行出棧和進棧的操作。所以佔用CPU時間除了代碼本身之外,對函數進行調用也需要佔據一定的時間。而宏就能節省參數壓棧、返回參數、C語言call調用以及執行return的操作步驟,從而提高程序的運行效率。
❷ 如何優化單片機C語言代碼 轉
優化代碼和優化速度實際上是一個予盾的統一,一般是優化了代碼的尺寸,就會帶來執行時間的增加,如果優化了程序的執行速度,通常會帶來代碼增加的副作用,很難魚與熊掌兼得,只能在設計時掌握一個平衡點。 一、程序結構的優化 1、程序的書寫結構雖然書寫格式並不會影響生成的代碼質量,但是在實際編寫程序時還是應該尊循一定的書寫規則,一個書寫清晰、明了的程序,有利於以後的維護。在書寫程序時,特別是對於While、for、do…while、if… elst、switch…case 等語句或這些語句嵌套組合時,應採用"縮格"的書寫形式, 2、標識符程序中使用的用戶標識鏈搏符除要遵循標識符的命名規則以外,一般不要用代數符號(如a、b、x1、y1)作為變數名,應選取具有相關含義的英文單詞(或縮寫)或漢語拼音作為標識符,以增加程序的可讀性,如:count、 number1、red、work 等。 3、程序結構C 語言是一種高級程序設計語言,提供了十分完備的規范化流程式控制制結構。因此在採用C 語言設計單片機應用系統程序時,首先要注意盡可能採用結構化的程序設計方法,這樣可使整個應用系統程序結構清晰,便於調試和維護。於一個較大的應用程序,通常將整個程序按功能分成若干個模塊,不同模塊完成不同的功能。各個模塊可以分別編寫,甚至還可以由不同的程序員編寫,一般單個模塊完成的功能較為簡單,設計和調試也相對容易一些。在模喚迅 C 語言中,一個函數就可以認為是一個模塊。所謂程序模塊化,不僅是要將整個程序劃分成若干個功能模塊,更重要的是,還應該注意保持各個模塊之間變數的相對獨立性,即保持模塊的獨立性,盡量少使用全局變數等。對於一些常用的功能模塊,還可以封裝為一個應用程序庫,以便需要時可以直接調用。但是在使用模塊化時,如果將模塊分成太細太小,又會導致程序的執行效率變低 (進入和退出一個函數時保護和恢復寄存器佔用了一些時間)。 4、定義常數在程序化設計過程中,對於經常使用的一些常數,如果將它直接寫到程序中去,一旦常數的數值發生變化,就必須逐個找出程序中所有的常數,並逐一進行修改,這樣必然會降低程序的可維護性。因此,應盡量當採用預處理命令方式來定義常數,而且還可以避免輸入錯誤。 5、減少判斷語句能夠使用條件編譯(ifdef)的地方就使用條件編譯而不使用if 語句,有利於減少編譯生成的代碼的長度。 6、表達式對於一個表達式中各種運算執行的優先順序不太明確或容易混淆的地方,應當採用圓括弧明確指定它們的優先順序。一個表達式通常不能寫得太復雜,如果表達式太復雜,時間久了以後,自己也不容易看得懂,不利於以後的維護。 7、函數對於程序中的函數,在使用之前,應對函數的類型進行說明,對函數類型的說明必須保證它與原來定義的函數類型一致,對於沒有參數和沒有返回值類型的函數應加上"void"說明。如果果需要縮短代碼的長度,可以將程序中一些公共的程序段定義為函數,在Keil 中的高級別優化就是這樣的。如果需要縮短程序的執行時間,在程序調試結束後,將部分函數用宏定義來代替。注意,應該在程序調試結束後再定義宏,因為大多數編譯系統在宏展開之後才會報錯,這樣會增加排錯的難度。 8、盡量少用全局變數,多用局部變數。因為全局變數是放在數據存儲器中,定義一個全局變數,MCU 就少一個可以利用的數據存儲器空間,如果定義了太多的全局變數,會導致編譯器無足夠的內存可以分配。而局部變數大多定位於 MCU 內部的寄存器中,在絕大多數MCU 中,使用寄存器操作速度比數據存儲器快,指令也更多更靈活,有利於生成質量更高的代碼,而且局部變數所的佔用的寄存器和數據存儲器在不同的模塊中可以重復利用。 9、設定合適的編譯程序選項許多編譯程序有幾種不同的優化選項,在使用前應理解各優化選項的含義,然後選用最合適的一種優化方式。通常情況下一旦旦此選用最高級優化,編譯程序會近乎病態地追求代碼優化,可能會影響程序的正確性,導致程序運行出錯。因此應熟悉所使用的編譯器,應知道哪些參數在優化時會受到影響,哪些參數不會受到影響。在ICCAVR 中,有"Default"和 "Enable Code Compression"兩個優化選項。在CodeVisionAVR 中,"Tiny"和 "small"兩種內存模式。在IAR==有7 種不同的內存模式選項。在GCCAVR 中優化選項更多,一不小心更容易選到不恰當的選項。 二、代碼的優化1、選擇合適的演算法和數據結構應該熟悉演算法語言,知道各種演算法的優缺點,具體資料請參見相應的參考資料,有很多計算機書籍上都有介紹。將比較慢的順序查找法用較快的二分查找或亂序查找法代替,插入排序或冒泡排序法用快速排序、合並排序或根排序代替,都可以大大提高程序執行的效率。.選擇一種合適的數據結構也很重要,比如你在一堆隨機存放的數中使用了大量的插入和刪除指令,那使用鏈表要快得多。數組與指針具有十分密碼的關系,一般來說,指針比較靈活簡潔,而數組則比較直觀,容易理解。對於大部分的編譯器,使用指針比使用數組生成的代碼更短,執行效率更高。但是在Keil 中則相反,使用數組比使用的指針生成的代碼更短。 2、使用盡量小的數據類型能夠使用字元型(char)定義的變數,就不要使用整型(int)變數來定義;能夠使用整型變數定義的變數就不要用長整型(long int),能不使用浮點型(float)變數就不要使用浮點型變數。當然,在定義變數後不要超過變數的作用范圍,如果超過變數的范圍賦值,C 編譯器並不報錯,但程序運行結果卻錯了,而且這樣的錯誤很難發現。在ICCAVR 中,可以在 Options 中設定使用printf 參數,盡量使用基本型參數(%c、%d、%x、%X、%u 和%s 格式說明符),少用長整型參數(%ld、%lu、%lx 和%lX 格式說明符),至於浮點型的參數(%f)則盡量不要使用,其它C 編譯器也一樣。在其它條件不變的情況下,使用%f 參數,會使生成的代碼的數量增加很多,執行速度降低。 3、使用自加、自減指令通常使用自加、自減指令和復合賦值表達式(如a- =1 及a+=1 等)都能夠生成高質量的程序代碼,編譯器通常都能夠生成inc 和 dec 之類的指令,而使用a=a+1 或a=a-1 之類的指令,有很多C 編譯器都會生成二到三個位元組的指令。在AVR 單片適用的ICCAVR、GCCAVR、IAR 等C 編譯器以上幾種書寫方式生成的代碼是一樣的,也能夠生成高質量的inc 和dec 之類的的代碼。 4、減少運算的強度可以使用運算量小但功能相同的表達式替換原來復雜的的表達式。如下:(1)、求余運算。a=a%8;可以改為:a=a&7;說明:位操作只需一個指令周期即可完成,而大部分的C 編譯器的"%"運算均是調用子程序來完成,代碼長、執行速度慢。通常,只要求是求2n 方的余數,均可使用位操作的方法來代替。(2)、平方運算a=pow(a,2.0);可以改為:a=a*a;說明:在有內置硬體乘法器的單片機中(如51 系列),乘法運算比求平方運算快得多,因為浮點數的求平方是通過調用子程序來實現的,在自帶硬體乘法器的 AVR 單片機中,如ATMega163 中,乘法運算只需2 個時鍾周期就可以完成。既使是在沒有內置硬體乘法器的AVR 單片機中,乘法運算的子程序比平方運算的子程序代碼短,執行速度快。如果是求3 次方,如:a=pow(a,3.0);更改為:a=a*a*a;則效率的改善更明顯。(3)、用移位實現乘除法運算 a=a*4;b=b/4;可以改為:a=a 2; b=b 2;說明:通常如果需要乘以或除以2n,都可以用移位的方法代替。在 ICCAVR 中,如果乘以2n,都可以生成左移的代碼,而乘以其它的整數或除以任何數,均調用乘除法子程序。用移位的方法得到代碼比調用乘除法子程序生成的代碼效率高。實際上,只要是乘以或除以一個整數,均可以用移位的方法得到結果,如:a=a*9 可以改為:a=(a 3)+a 5、循環(1)、循環語對於一些不需要循環變數參加運算的任務可以把它們放到循環外面,這里的任務包括表達式、函數的調用、指針運算、數組訪問等,應該將沒有必要執行多次的操作全部集合在一起,放到一個init 的初始化程序中進行。(2)、延時函數:通常使用的延時函數均採用自加的形式:void delay(void){unsigned int i;for(i=0;i 1000;i++);}將其改為自減延時函數:void delay(void){unsigned int i; for(i=1000;i 0;i--);}兩個函數的延時效果相似,但幾乎所有的C 編譯對後一種函數生成的代碼均比前一種代碼少1~3 個位元組,因為幾乎所有的MCU 均有為0 轉移的指令,採用後一種方式能夠生成這類指令。在使用while 循環時也一樣,使用自減指令控制循環會比使用自加指令控制循環生成的代碼更少 1~3 個字母。但是在循環中有通過循環變數"i"讀寫數組的指令時,使用預減循環時有可能使數組超界,要引起注意。(3)while 循環和do…while 循環用 while 循環時有以下兩種循環形式:unsigned int i;i=0;while(i 1000){i++;//用戶程序}或:unsigned int i;i=1000;do i--;//用戶程序 while(i 0);在這兩種循環中,使用do…while 循環編譯後生成的代碼的長度短於while 循環。6、查表在程序中一般不進行非常復雜的運算,如浮點數的乘除及開方等,以及一些復雜的數學模型的插補運算,對這些即消耗時間又消費資源的運算,應盡量使用查表的方式,並且將數據表置於程序存儲區。如果直接生成所需的表比較困難,也盡量在啟動時先計算,然後在數據存儲器中生成所需的表,後以在程序運行直接查表就可以了,減少了程序執行過程中重復計算的工作量。7、其它比如使用在線匯編及將字元串和一些常量保存在程序存儲器中,均有利於優化。
❸ 本科獨立用C語言完成沒有優化的C語言編譯器屬於什麼水平
我覺得水平還是很高的,但意義恐怕不大。編譯器技術是非常成熟的領域,而且由於應用場景的限
制實時,復雜的演算法已經自動出局了,你可選的東西是有限的。編譯器可能有很多實現的形
式,虛擬機/解釋器/靜態編譯器 等,也有成熟的開源實現。作為本科生,而非專門研究該分支的學生,應該合理分配自己學習的時間,如果做這個編譯器就干
掉了大半年,那計網和OS這些課程該咋辦?
我知道很多人會認為沒有做編譯器優化特指中段優化,不考慮機器碼上的優化比較劃水。但編
譯器優化是一個很復雜的東西:首先它和你用的IR表示有關而且是強烈耦合,SSA IR基本還
好,有開源代碼和文獻記載,你想要的都能在網上挖到但這怎麼體現你的水平是吧。你
要考慮編譯器的性能,盡管編譯器的後端優化基本上可以納入到某種PEabstract interpretation的
范疇中。
要不然你可以通過編寫插件的方式白嫖例如visual studio code這類軟
件的強大編輯功能,如果你寫的不是c compiler,你也可以盡量把語法設計得很像c,這樣你又能進一步
白嫖其強大的intellisense code,當然仍然有不少人或者應該說團隊達到了這一步,到這里,應該卷死
了99.99%的同行應該毫無問題。
❹ C語言寫程序提高程序效率減小空間的方法都有哪些
演算法級別的顯然是最主要的優化,一個平方級演算法和一個超線性演算法的時間復雜度天差地別。但如果已經達到了演算法的下界,那麼就只能是針對程序進行優化了。其實編譯器乾的壞事往往比好事多,尤其是在做並行的時候~另外,先檢查下是否需要優化,如果不是瓶頸的地方再優化也沒有明顯效果,常用的優化手段一般是增大並行度,指令級或者線程級的,還有就是針對內存結構的特殊處理等等。具體可以參考計算機系統結構——量化研究方法,第三版我覺得不錯,第四版沒看。至於用C的話,比較靈活,比如自己消除遞歸,循環強度削弱,使用宏函數或者內聯函數,內嵌匯編等等都可以,視情況而定了。
❺ C語言文件的編譯與執行的四個階段並分別描述
開發C程序有四個步驟:編輯、編譯、連接和運行。
任何一個體系結構處理器上都可以使用C語言程序,只要該體系結構處理器有相應的C語言編譯器和庫,那麼C源代碼就可以編譯並連接到目標二進制文件上運行。
1、預處理:導入源程序並保存(C文件)。
2、編譯:將源程序轉換為目標文件(Obj文件)。
3、鏈接:將目標文件生成為可執行文件(EXE文件)。
4、運行:執行,獲取運行結果的EXE文件。
(5)c語言編譯優化擴展閱讀:
將C語言代碼分為程序的幾個階段:
1、首先,源代碼文件測試。以及相關的頭文件,比如stdio。H、由預處理器CPP預處理為.I文件。預編譯的。文件不包含任何宏定義,因為所有宏都已展開,並且包含的文件已插入。我歸檔。
2、編譯過程是對預處理文件進行詞法分析、語法分析、語義分析和優化,生成相應的匯編代碼文件。這個過程往往是整個程序的核心部分,也是最復雜的部分之一。
3、匯編程序不直接輸出可執行文件,而是輸出目標文件。匯編程序可以調用LD來生成可以運行的可執行程序。也就是說,您需要鏈接大量的文件才能獲得「a.out」,即最終的可執行文件。
4、在鏈接過程中,需要重新調整其他目標文件中定義的函數調用指令,而其他目標文件中定義的變數也存在同樣的問題。
❻ C語言編程解決最優化問題
C語言是一門通用計算機編程語言,廣泛應用於底層開發。C語言的設計目標是提供一種能以簡易的方式編譯、處理低級存儲器、產生少量的機器碼以及不需要任何運行環境支持便能運行的編程語言。
盡管C語言提供了許多低級處理的功能,但仍然保持著良好跨平台的特性,以一個標准規格寫出的C語言程序可在許多電腦平台上進行編譯,甚至包含一些嵌入式處理器(單片機或稱MCU)以及超級電腦等作業平台。
二十世紀八十年代,為了避免各開發廠商用的C語言語法產生差異,由美國國家標准局為C語言制定了一套完整的美國國家標准語法,稱為ANSI C,作為C語言最初的標准。 目前2011年12月8日,國際標准化組織(ISO)和國際電工委員會(IEC)發布的C11標準是C語言的第三個官方標准,也是C語言的最新標准,該標准更好的支持了漢字函數名和漢字標識符,一定程度上實現了漢字編程。
C語言是一門面向過程的計算機編程語言,與C++,Java等面向對象的編程語言有所不同。
其編譯器主要有Clang、GCC、WIN-TC、SUBLIME、MSVC、Turbo C等。
❼ C語言編譯,如何減少內存
用時再申請內存,用完了就放掉,要考慮到變數的生命周期,在合適的位置聲明變數
❽ 一個關於C語言語句用匯編優化的問題:
生成的匯編已經夠精簡了,看起來你是在一個雙重循環中使用了這句
內聯滑升余匯編應該解決不了這里的效率問題,可以嘗試修改你這段代碼,比如,內層的循環,那個指針沒必信滾要重復計算和載入
double temp1,temp2;
for(int j=0; j < MMM; j++)
{
double *dbp = hpdf->b[j]->var->vec;
for(int i=0;i <NNN;i++)
temp2+=temp1*temp1*dbp[i];
}
又比如,temp1的平方如果是在外層就可笑睜以計算的,也沒必要在內層循環計算
這只是個修改的思路,你再看編譯出來的代碼情況
❾ C語言此處的運算編譯器會自動優化嗎
這個要看你使用什麼編譯器了。查看編譯器的幫助文檔,它會告訴你它支持那些指令集,並且做哪些可能的優化。
不同的編譯器,是不一樣的。
補充:GCC 不太清楚,你連VC++的版本都不說。汗,VC6是不支持SSE的,需要安裝VC6SP5。
VS2005 和 VS2008 都支持 SSE。對 SSE/MMX 指令集優化得最好的,還是 Intel 的 c++ 編譯器。
對並行和高性能計算,Fortran 的優勢比較大。特別是 Fortran2003 的新特徵,為並行計算做了很多專門的設定。Intel 也有 Fortran 的編譯器。
❿ 如何優化你的C代碼
一、程序結構的優化
1、程序的書寫結構
雖然書寫格式並不會影響生成的代碼質量,但是在實際編寫程序時還是應該尊循一定的書寫規則,一個書寫清晰、明了的程序,有利於以後的維護。在書寫程序時,特別是對於While、for、do…while、if…elst、switch…case等語句或這些語句嵌套組合時,應採用「縮格」的書寫形式,
2、標識符
程序中使用的用戶標識符除要遵循標識符的命名規則以外,一般不要用代數符號(如a、b、x1、y1)作為變數名,應選取具有相關含義的英文單詞(或縮寫)或漢語拼音作為標識符,以增加程序的可讀性,如:count、number1、red、work等。
3、程序結構
C語言是一種高級程序設計語言,提供了十分完備的規范化流程式控制制結構。因此在採用C語言設計單片機應用系統程序時,首先要注意盡可能採用結構化的程序設計方法,這樣可使整個應用系統程序結構清晰,便於調試和維護。於一個較大的應用程序,通常將整個程序按功能分成若干個模塊,不同模塊完成不同的功能。各個模塊可以分別編寫,甚至還可以由不同的程序員編寫,一般單個模塊完成的功能較為簡單,設計和調試也相對容易一些。在C語言中,一個函數就可以認為是一個模塊。所謂程序模塊化,不僅是要將整個程序劃分成若干個功能模塊,更重要的是,還應該注意保持各個模塊之間變數的相對獨立性,即保持模塊的獨立性,盡量少使用全局變數等。對於一些常用的功能模塊,還可以封裝為一個應用程序庫,以便需要時可以直接調用。但是在使用模塊化時,如果將模塊分成太細太小,又會導致程序的執行效率變低(進入和退出一個函數時保護和恢復寄存器佔用了一些時間)。
4、定義常數
在程序化設計過程中,對於經常使用的一些常數,如果將它直接寫到程序中去,一旦常數的數值發生變化,就必須逐個找出程序中所有的常數,並逐一進行修改,這樣必然會降低程序的可維護性。因此,應盡量當採用預處理命令方式來定義常數,而且還可以避免輸入錯誤。
5、減少判斷語句
能夠使用條件編譯(ifdef)的地方就使用條件編譯而不使用if語句,有利於減少編譯生成的代碼的長度,能夠不用判斷語句則少用判斷用語句。
6、表達式
對於一個表達式中各種運算執行的優先順序不太明確或容易混淆的地方,應當採用圓括弧明確指定它們的優先順序。一個表達式通常不能寫得太復雜,如果表達式太復雜,時間久了以後,自己也不容易看得懂,不利於以後的維護。
7、函數
對於程序中的函數,在使用之前,應對函數的類型進行說明,對函數類型的說明必須保證它與原來定義的函數類型一致,對於沒有參數和沒有返回值類型的函數應加上「void」說明。如果果需要縮短代碼的長度,可以將程序中一些公共的程序段定義為函數,在Keil中的高級別優化就是這樣的。如果需要縮短程序的執行時間,在程序調試結束後,將部分函數用宏定義來代替。注意,應該在程序調試結束後再定義宏,因為大多數編譯系統在宏展開之後才會報錯,這樣會增加排錯的難度。
8、盡量少用全局變數,多用局部變數。
因為全局變數是放在數據存儲器中,定義一個全局變數,MCU就少一個可以利用的數據存儲器空間,如果定義了太多的全局變數,會導致編譯器無足夠的內存可以分配。而局部變數大多定位於MCU內部的寄存器中,在絕大多數MCU中,使用寄存器操作速度比數據存儲器快,指令也更多更靈活,有利於生成質量更高的代碼,而且局部變數所的佔用的寄存器和數據存儲器在不同的模塊中可以重復利用。
9、設定合適的編譯程序選項
許多編譯程序有幾種不同的優化選項,在使用前應理解各優化選項的含義,然後選用最合適的一種優化方式。通常情況下一旦選用最高級優化,編譯程序會近乎病態地追求代碼優化,可能會影響程序的正確性,導致程序運行出錯。因此應熟悉所使用的編譯器,應知道哪些參數在優化時會受到影響,哪些參數不會受到影響。
在ICCAVR中,有「Default」和「Enable Code Compression」兩個優化選項。
在CodeVisionAVR中,「Tiny」和「small」兩種內存模式。
在IAR中,共有7種不同的內存模式選項。
在GCCAVR中優化選項更多,一不小心更容易選到不恰當的選項。
二、代碼的優化
1、選擇合適的演算法和數據結構
應該熟悉演算法語言,知道各種演算法的優缺點,具體資料請參見相應的參考資料,有很多計算機書籍上都有介紹。將比較慢的順序查找法用較快的二分查找或亂序查找法代替,插入排序或冒泡排序法用快速排序、合並排序或根排序代替,都可以大大提高程序執行的效率。.選擇一種合適的數據結構也很重要,比如你在一堆隨機存放的數中使用了大量的插入和刪除指令,那使用鏈表要快得多。
數組與指針語句具有十分密碼的關系,一般來說,指針比較靈活簡潔,而數組則比較直觀,容易理解。對於大部分的編譯器,使用指針比使用數組生成的代碼更短,執行效率更高。但是在Keil中則相反,使用數組比使用的指針生成的代碼更短。。
3、使用盡量小的數據類型
能夠使用字元型(char)定義的變數,就不要使用整型(int)變數來定義;能夠使用整型變數定義的變數就不要用長整型(long int),能不使用浮點型(float)變數就不要使用浮點型變數。當然,在定義變數後不要超過變數的作用范圍,如果超過變數的范圍賦值,C編譯器並不報錯,但程序運行結果卻錯了,而且這樣的錯誤很難發現。
在ICCAVR中,可以在Options中設定使用printf參數,盡量使用基本型參數(%c、%d、%x、%X、%u和%s格式說明符),少用長整型參數(%ld、%lu、%lx和%lX格式說明符),至於浮點型的參數(%f)則盡量不要使用,其它C編譯器也一樣。在其它條件不變的情況下,使用%f參數,會使生成的代碼的數量增加很多,執行速度降低。
4、使用自加、自減指令
通常使用自加、自減指令和復合賦值表達式(如a-=1及a+=1等)都能夠生成高質量的程序代碼,編譯器通常都能夠生成inc和dec之類的指令,而使用a=a+1或a=a-1之類的指令,有很多C編譯器都會生成二到三個位元組的指令。在AVR單片適用的ICCAVR、GCCAVR、IAR等C編譯器以上幾種書寫方式生成的代碼是一樣的,也能夠生成高質量的inc和dec之類的的代碼。
5、減少運算的強度
可以使用運算量小但功能相同的表達式替換原來復雜的的表達式。如下:
(1)、求余運算。
a=a%8;
可以改為:
a=a&7;
說明:位操作只需一個指令周期即可完成,而大部分的C編譯器的「%」運算均是調用子程序來完成,代碼長、執行速度慢。通常,只要求是求2n方的余數,均可使用位操作的方法來代替。
(2)、平方運算
a=pow(a,2.0);
可以改為:
a=a*a;
說明:在有內置硬體乘法器的單片機中(如51系列),乘法運算比求平方運算快得多,因為浮點數的求平方是通過調用子程序來實現的,在自帶硬體乘法器的AVR單片機中,如ATMega163中,乘法運算只需2個時鍾周期就可以完成。既使是在沒有內置硬體乘法器的AVR單片機中,乘法運算的子程序比平方運算的子程序代碼短,執行速度快。
如果是求3次方,如:
a=pow(a,3.0);
更改為:
a=a*a*a;
則效率的改善更明顯。
(3)、用移位實現乘除法運算
a=a*4;
b=b/4;
可以改為:
a=a<<2;
b=b>>2;
說明:通常如果需要乘以或除以2n,都可以用移位的方法代替。在ICCAVR中,如果乘以2n,都可以生成左移的代碼,而乘以其它的整數或除以任何數,均調用乘除法子程序。用移位的方法得到代碼比調用乘除法子程序生成的代碼效率高。實際上,只要是乘以或除以一個整數,均可以用移位的方法得到結果,如:
a=a*9
可以改為:
a=(a<<3)+a
6、循環
(1)、循環語
對於一些不需要循環變數參加運算的任務可以把它們放到循環外面,這里的任務包括表達式、函數的調用、指針運算、數組訪問等,應該將沒有必要執行多次的操作全部集合在一起,放到一個init的初始化程序中進行。
(2)、延時函數:
通常使用的延時函數均採用自加的形式:
void delay (void)
{
unsigned int i;
for (i=0;i<1000;i++)
;
}
將其改為自減延時函數:
void delay (void)
{
unsigned int i;
for (i=1000;i>0;i--)
;
}
兩個函數的延時效果相似,但幾乎所有的C編譯對後一種函數生成的代碼均比前一種代碼少1~3個位元組,因為幾乎所有的MCU均有為0轉移的指令,採用後一種方式能夠生成這類指令。
在使用while循環時也一樣,使用自減指令控制循環會比使用自加指令控制循環生成的代碼更少1~3個字母。
但是在循環中有通過循環變數「i」讀寫數組的指令時,使用預減循環時有可能使數組超界,要引起注意。
(3)while循環和do…while循環
用while循環時有以下兩種循環形式:
unsigned int i;
i=0;
while (i<1000)
{
i++;
//用戶程序
}
或:
unsigned int i;
i=1000;
do
i--;
//用戶程序
while (i>0);
在這兩種循環中,使用do…while循環編譯後生成的代碼的長度短於while循環。
7、查表
在程序中一般不進行非常復雜的運算,如浮點數的乘除及開方等,以及一些復雜的數學模型的插補運算,對這些即消耗時間又消費資源的運算,應盡量使用查表的方式,並且將數據表置於程序存儲區。如果直接生成所需的表比較困難,也盡量在啟動時先計算,然後在數據存儲器中生成所需的表,後以在程序運行直接查表就可以了,減少了程序執行過程中重復計算的工作量。