編譯的三個子過程
『壹』 編譯過程可分為幾個階段
編譯程序把一個源程序翻譯成目標程序的工作過程分為五個階段:詞法分析;語法分析;中間代碼生成;代碼優化;目標代碼生成。
編譯程序一般分為詞法分析、語法分析、語義分析與中間代碼產生、代碼優化、目標代碼生成程序5個階段:
下面是對編譯過程的五個階段的詳解
對於編譯程序的工作,從輸入源程序開始到輸出目標程序為止的整個過程,是非常復雜的。但就其過程而言,它與人們進行自然語言直接的翻譯有許多相近之處。當我們把一種文字翻譯為另一種文字,例如把一段英文翻譯為中文時,通常需要經以下列幾個步驟:
(1)先要識別出句子中的一個個單詞;
(2)分析句子的語法結構;
(3)根據句子的含義進行初步翻譯;
(4)對譯文進行修飾;
(5)寫出最後的譯文。
類似地,我們可以把編譯程序的工作過程劃分為五個階段:詞法分析、語法分析、語義分析與中間代碼產生、優化和目標代碼生成。
第一階段:詞法分析
詞法分析的任務是:輸入源程序,對構成源程序的字元串進行掃描和分解,識別出一個個的單詞(亦稱單詞符號或簡稱符號),如基本字(begin、end、if、for、while),標識符、常數、運算符和界符(標點符號、左右括弧)。
單詞符號是語言的基本組成成分,是人們理解和編寫程序的基本要素。識別和理解這些要素無疑也是翻譯的基礎。如同將英文翻譯成中文的情形一樣,如果你對英語單詞不理解,那就談不上進行正確的翻譯。在詞法分析階段的工作中所依循的是語言的詞法規則(或稱構詞規則)。描述詞法規則的有效工具是正規式和有效自動機。
第二階段:語法分析
語法分析的任務是:在詞法分析的基礎上,根據語言的語法規則,把單詞符號串分解成各類語法單位(語法范疇),如「短語」、「句子」、「程序段」和「程序」等。通過語法分析,確定整個輸入串是否構成語法上正確的「程序」。語法分析所依循的是語言的語法規則。語法規則通常用上下文無關文法描述。詞法分析是一種線性分析,而語法分析是一種層次結構分析。例如:Z= X + 0168*Y;代表一個「賦值語句」,而其中的代表X + 0168*Y一個「算術表達式」。因而,語法分析的任務就是識別X + 0.618 * Y為算術表達式,同時,十倍上述整個符號串屬於賦值語句這個范疇。
第三階段:語義分析與中間代碼產生
這一階段的任務是:對語法分析所識別出的各類語法范疇,分析其含義,並進行初步翻譯(產生中間代碼)。這一階段通常包含兩個方面的工作。首先,對每種語法范疇進行語義i安插,例如,變數是否定義、類型是否正確等等。如果語義正確,則進行另一方面工作,即進行中間代碼的解釋。
這一階段所依循的是語言的語義規則。通常使用屬性文法描述語義規則。「翻譯」僅僅在這里才開始涉及到。所謂「中間代碼」是一種含義明確、便於處理的記號系統,它通常獨立於具體的硬體。這種記號系統或者與現代計算機的指令形式有某種程度的接近,或者能夠比較容易地把它變換成現代計算機的機器指令。
例如,許多編譯程序採用了一種與「三地址指令」非常近似的「四元式」作為中間代碼。它的意義是:對「左右操作數」進行某種運(由「算符」指明),把運算所得的值作為「結果」保留下來。在採用四元式作為中間代碼的情形下,中間代碼產生的任務就是按語言的語法規則把各類范疇翻譯成四元式序列。
一般而言,中間代碼是一種獨立於具體硬體的記號系統。常用的中間大媽,除了四元式之外,還有三元式、間接三元式、逆波蘭記號和樹形表示等等。
第四階段:代碼優化
優化的任務在於對前段產生的中間代碼進行加工變換,以期在最後階段能產生出更為高效(省時間和空間)的目標代碼。優化的主要方面有:公關子表達式的提取、循環優化、刪除無用代碼等等。有時,為了便於「並行運算」,還可以對代碼進行並行化處理。優化所依循的原則是程序的等價變換規則。
第五階段:目標代碼生成程序
這一階段的任務是:把中間代碼(或經優化處理之後)變換成特定機器上的低級語言代碼。這階段實現了最後的翻譯,它的工作有賴於硬體系統結構和機器指令含義。這階段工作非常復雜,設計到硬體系統功能部件的運用,機器指令的選擇,各種數據類型變數的存儲空間分配,以及寄存器和後援寄存器的調度,等等。
目標代碼的形式可以是絕對指令代碼或可重定位的指令代碼或匯編指令代碼。如目標代碼是絕對指令代碼,則這種目標代碼可立即執行。如果目標代碼是匯編指令代碼,則需匯編器匯編之後才行運行。必須指出,現在多數實用編譯程序所產生的目標代碼都是一種可重定位的指令代碼。這種目標代碼在運行前必須藉助於一個連接裝配程序把各個目標模塊(包括系統提供的庫函數)連接在一起,確定程序變數(或常數)在主存中的位置,裝入內存中指定的起始地址,使之成為一個可以運行的絕對指令代碼程序。
『貳』 編譯原理全部的名詞解釋
書上有別那麼懶!.
編譯過程的六個階段:詞法分析,語法分析,語義分析,中間代碼生成,代碼優化,目標代碼生成
解釋程序:把某種語言的源程序轉換成等價的另一種語言程序——目標語言程序,然後再執行目標程序.解釋方式是接受某高級語言的一個語句輸入,進行解釋並控制計算機執行,馬上得到這句的執行結果,然後再接受下一句.
編譯程序:就是指這樣一種程序,通過它能夠將用高級語言編寫的源程序轉換成與之在邏輯上等價的低級語言形式的目標程序(機器語言程序或匯編語言程序).
解釋程序和編譯程序的根本區別:是否生成目標代碼
句子的二義性(這里的二義性是指語法結構上的.):文法G[S]的一個句子如果能找到兩種不同的最左推導(或最右推導),或者存在兩棵不同的語法樹,則稱這個句子是二義性的.
文法的二義性:一個文法如果包含二義性的句子,則這個文法是二義文法,否則是無二義文法.
LL(1)的含義:(LL(1)文法是無二義的; LL(1)文法不含左遞歸)
第1個L:從左到右掃描輸入串 第2個L:生成的是最左推導
1 :向右看1個輸入符號便可決定選擇哪個產生式
某些非LL(1)文法到LL(1)文法的等價變換: 1. 提取公因子 2. 消除左遞歸
文法符號的屬性:單詞的含義,即與文法符號相關的一些信息.如,類型、值、存儲地址等.
一個屬性文法(attribute grammar)是一個三元組A=(G, V, F)
G:上下文無關文法.
V:屬性的有窮集.每個屬性與文法的一個終結符或非終結符相連.屬性與變數一樣,可以進行計算和傳遞.
F:關於屬性的斷言或謂詞(一組屬性的計算規則)的有窮集.斷言或語義規則與一個產生式相聯,只引用該產生式左端或右端的終結符或非終結符相聯的屬性.
綜合屬性:若產生式左部的單非終結符A的屬性值由右部各非終結符的屬性值決定,則A的屬性稱為綜合屬
繼承屬性:若產生式右部符號B的屬性值是根據左部非終結符的屬性值或者右部其它符號的屬性值決定的,則B的屬性為繼承屬性.
(1)非終結符既可有綜合屬性也可有繼承屬性,但文法開始符號沒有繼承屬性.
(2) 終結符只有綜合屬性,沒有繼承屬性,它們由詞法程序提供.
在計算時: 綜合屬性沿屬性語法樹向上傳遞;繼承屬性沿屬性語法樹向下傳遞.
語法制導翻譯:是指在語法分析過程中,完成附加在所使用的產生式上的語義規則描述的動作.
語法制導翻譯實現:對單詞符號串進行語法分析,構造語法分析樹,然後根據需要構造屬性依賴圖,遍歷語法樹並在語法樹的各結點處按語義規則進行計算.
中間代碼(中間語言)
1、是復雜性介於源程序語言和機器語言的一種表示形式.
2、一般,快速編譯程序直接生成目標代碼.
3、為了使編譯程序結構在邏輯上更為簡單明確,常採用中間代碼,這樣可以將與機器相關的某些實現細節置於代碼生成階段仔細處理,並且可以在中間代碼一級進行優化工作,使得代碼優化比較容易實現.
何謂中間代碼:源程序的一種內部表示,不依賴目標機的結構,易於代碼的機械生成.
為何要轉換成中間代碼:(1)邏輯結構清楚;利於不同目標機上實現同一種語言.
(2)便於移植,便於修改,便於進行與機器無關的優化.
中間代碼的幾種形式:逆波蘭記號 ,三元式和樹形表示 ,四元式
符號表的一般形式:一張符號表的的組成包括兩項,即名字欄和信息欄.
信息欄包含許多子欄和標志位,用來記錄相應名字和種種不同屬性,名字欄也稱主欄.主欄的內容稱為關鍵字(key word).
符號表的功能:(1)收集符號屬性 (2) 上下文語義的合法性檢查的依據: 檢查標識符屬性在上下文中的一致性和合法性.(3)作為目標代碼生成階段地址分配的依據
符號的主要屬性及作用:
1. 符號名 2. 符號的類型 (整型、實型、字元串型等))3. 符號的存儲類別(公共、私有)
4. 符號的作用域及可視性 (全局、局部) 5. 符號變數的存儲分配信息 (靜態存儲區、動態存儲區)
存儲分配方案策略:靜態存儲分配;動態存儲分配:棧式、 堆式.
靜態存儲分配
1、基本策略
在編譯時就安排好目標程序運行時的全部數據空間,並能確定每個數據項的單元地址.
2、適用的分配對象:子程序的目標代碼段;全局數據目標(全局變數)
3、靜態存儲分配的要求:不允許遞歸調用,不含有可變數組.
FORTRAN程序是段結構,不允許遞歸,數據名大小、性質固定. 是典型的靜態分配
動態存儲分配
1、如果一個程序設計語言允許遞歸過程、可變數組或允許用戶自由申請和釋放空間,那麼,就需要採用動態存儲管理技術.
2、兩種動態存儲分配方式:棧式,堆式
棧式動態存儲分配
分配策略:將整個程序的數據空間設計為一個棧.
【例】在具有遞歸結構的語言程序中,每當調用一個過程時,它所需的數據空間就分配在棧頂,每當過程工作結束時就釋放這部分空間.
過程所需的數據空間包括兩部分
一部分是生存期在本過程這次活動中的數據對象.如局部變數、參數單元、臨時變數等;
另一部分則是用以管理過程活動的記錄信息(連接數據).
活動記錄(AR)
一個過程的一次執行所需要的信息使用一個連續的存儲區來管理,這個區 (塊)叫做一個活動記錄.
構成
1、臨時工作單元;2、局部變數;3、機器狀態信息;4、存取鏈;
5、控制鏈;6、實參;7、返回地址
什麼是代碼優化
所謂優化,就是對代碼進行等價變換,使得變換後的代碼運行結果與變換前代碼運行結果相同,而運行速度加快或佔用存儲空間減少.
優化原則:等價原則:經過優化後不應改變程序運行的結果.
有效原則:使優化後所產生的目標代碼運行時間較短,佔用的存儲空間較小.
合算原則:以盡可能低的代價取得較好的優化效果.
常見的優化技術
(1) 刪除多餘運算(刪除公共子表達式) (2) 代碼外提 +刪除歸納變數+ (3)強度削弱; (4)變換循環控制條件 (5)合並已知量與復寫傳播 (6)刪除無用賦值
基本塊定義
程序中只有一個入口和一個出口的一段順序執行的語句序列,稱為程序的一個基本塊.
給我分數啊.
『叄』 編譯是什麼
編譯是指將源代碼轉換為可執行代碼的過程。
編譯的詳細解釋:
1. 編譯的基本定義
在計算機科學中,編譯是一個重要的過程,其主要作用是將人類編寫的源代碼轉換為計算機可以直接執行的機器代碼。這個過程通常由編譯器完成。編譯器將源代碼進行語法分析、優化處理,最終生成目標代碼。
2. 編譯過程的細節
編譯過程通常分為幾個階段。首先是詞法分析,編譯器檢查源代碼中的每個詞並識別它們代表什麼。接下來是語法分析,編譯器檢查這些詞如何組合成有意義的句子或表達式。然後,進行語義分析,檢查代碼是否按照預期的意圖進行工作。最後,生成目標代碼,這些代碼可以直接由計算機執行。在某些情況下,編譯器還會進行代碼優化,以提高生成的代碼的性能。
3. 編譯的重要性
編譯在軟體開發中起著至關重要的作用。它確保了源代碼的兼容性和可移植性,使得在不同的計算機或操作系統上運行成為可能。此外,編譯過程還能檢測出源代碼中的錯誤,提高軟體的質量和穩定性。通過編譯,開發者可以將他們的想法和創意轉化為實際的軟體產品,滿足用戶的需求。
總的來說,編譯是將源代碼轉換為可執行代碼的關鍵過程,涉及多個階段和復雜的處理,確保了軟體開發的順利進行和最終產品的質量。
『肆』 什麼是編譯程序
編譯程序指將某一種程序設計語言寫的程序翻譯成等價的另一種語言的程序的程序, 稱之為編譯程序
編譯程序也稱為編譯器,是指把用高級程序設計語言書寫的源程序,翻譯成等價的機器語言格式目標程序的翻譯程序。編譯程序屬於採用生成性實現途徑實現的翻譯程序。
它以高級程序設計語言書寫的源程序作為輸入,而以匯編語言或機器語言表示的目標程序作為輸出。編譯出的目標程序通常還要經歷運行階段,以便在運行程序的支持下運行,加工初始數據,算出所需的計算結果。
編譯程序的實現演算法較為復雜,這是因為它所翻譯的語句與目標語言的指令不是一一對應關系,而是一多對應關系,同時也因為它要處理遞歸調用、動態存儲分配、多種數據類型,以及語句間的緊密依賴關系。
由於高級程序設計語言書寫的程序具有易讀、易移植和表達能力強等特點,編譯程序廣泛地用於翻譯規模較大、復雜性較高、且需要高效運行的高級語言書寫的源程序。
(4)編譯的三個子過程擴展閱讀:
編譯流程分為了四個步驟:
1.預處理,生成預編譯文件(.文件)
2.編譯,生成匯編代碼(.s文件)
3.匯編,生成目標文件(.o文件)
4.鏈接,生成可執行文件