編譯程序匯編程序鏈接程序
【答案】:D
語言處理程序包括匯編程序、編譯程序和解釋程序3個基本類型。
匯編程序是指把匯編語言書寫的程序翻譯成與之等價的機器語言程序的翻譯程序;
編譯程序也稱為編譯器,是指把用高級程序設計語言書寫的源程序,翻譯成等價的機器語言格式目標程序的翻譯程序;
解釋程序是高級語言翻譯程序的一種,它將源語言書寫的源程序作為輸入,解釋一句後就提交計算機執行一句,並不形成目標程序。
故正確答案為D。
2. (1)什麼是源程序(對匯編來說)、匯編程序(編譯程序)、連接程序、目標程序、執行程序
(1)略
(2)略
(3)
數據是被定義在數據段的,函數是被定義在代碼段的
變數通過內存定址方式來獲取,比如mov ax,[1234]
函數是通過call指令來調用的,並通過ret指令返回
(4)
C的輸入輸出一般直接用函數解決
而匯編既可以通過調用系統的中斷,也可以通過操作硬體的方式來實現
比如鍵盤輸入可以預先設置int 9中斷,在其中直接讀取鍵盤的埠
顯示器輸出可以通過直接寫現存的方式實現,或者直接控制顯卡
公共資源的共享其實就是把那些數據的內存地址讓大家都知道唄
(5)
先把C的源碼編譯了,然後用反匯編軟體(DEBUG或OllyDBG)反匯編
不過這種方法有點不是讓人很愉快,因為高級語言生成的匯編指令非常多,常常會會讓你找不到北
3. c語言文件的編譯與執行的四個階段並分別描述
編譯,編譯程序讀取源程序(字元流),對之進行詞法和語法的分析,將高級語言指令轉換為功能等效的匯編代碼,再由匯編程序轉換為機器語言,並且按照操作系統對可執行文件格式的要求鏈接生成可執行程序。
C源程序頭文件-->預編譯處理(cpp)-->編譯程序本身-->優化程序-->匯編程序-->鏈接程序-->可執行文件
1.編譯預處理
讀取c源程序,對其中的偽指令(以#開頭的指令)和特殊符號進行處理
偽指令主要包括以下四個方面
(1)宏定義指 令,如#define Name TokenString,#undef等。對於前一個偽指令,預編譯所要做的是將程序中的所有Name用TokenString替換,但作為字元串常量的 Name則不被替換。對於後者,則將取消對某個宏的定義,使以後該串的出現不再被替換。
(2)條件編譯指令,如#ifdef,#ifndef,#else,#elif,#endif,等等。這些偽指令的引入使得程序員可以通過定義不同的宏來決定編譯程序對哪些代碼進行處理。預編譯程序將根據有關的文件,將那些不必要的代碼過濾掉
(3) 頭文件包含指令,如#include "FileName"或者#include <FileName>等。在頭文件中一般用偽指令#define定義了大量的宏(最常見的是字元常量),同時包含有各種外部符號的聲明。採用 頭文件的目的主要是為了使某些定義可以供多個不同的C源程序使用。因為在需要用到這些定義的C源程序中,只需加上一條#include語句即可,而不必再 在此文件中將這些定義重復一遍。預編譯程序將把頭文件中的定義統統都加入到它所產生的輸出文件中,以供編譯程序對之進行處理。
包含到c源 程序中的頭文件可以是系統提供的,這些頭文件一般被放在/usr/include目錄下。在程序中#include它們要使用尖括弧(< >)。另外開發人員也可以定義自己的頭文件,這些文件一般與c源程序放在同一目錄下,此時在#include中要用雙引號("")。
(4)特殊符號,預編譯程序可以識別一些特殊的符號。例如在源程序中出現的LINE標識將被解釋為當前行號(十進制數),FILE則被解釋為當前被編譯的C源程序的名稱。預編譯程序對於在源程序中出現的這些串將用合適的值進行替換。
預編譯程序所完成的基本上是對源程序的「替代」工作。經過此種替代,生成一個沒有宏定義、沒有條件編譯指令、沒有特殊符號的輸出文件。這個文件的含義同沒有經過預處理的源文件是相同的,但內容有所不同。下一步,此輸出文件將作為編譯程序的輸出而被翻譯成為機器指令。
2.編譯階段
經過預編譯得到的輸出文件中,將只有常量。如數字、字元串、變數的定義,以及C語言的關鍵字,如main,if,else,for,while,{,}, +,-,*,\,等等。預編譯程序所要作得工作就是通過詞法分析和語法分析,在確認所有的指令都符合語法規則之後,將其翻譯成等價的中間代碼表示或匯編代 碼。
3.優化階段
優化處理是編譯系統中一項比較艱深的技術。它涉及到的問題不僅同編譯技術本身有關,而且同機器的硬體環境也有很大的關系。優化一部分是對中間代碼的優化。 這種優化不依賴於具體的計算機。另一種優化則主要針對目標代碼的生成而進行的。上圖中,我們將優化階段放在編譯程序的後面,這是一種比較籠統的表示。
對於前一種優化,主要的工作是刪除公共表達式、循環優化(代碼外提、強度削弱、變換循環控制條件、已知量的合並等)、復寫傳播,以及無用賦值的刪除,等等。
後 一種類型的優化同機器的硬體結構密切相關,最主要的是考慮是如何充分利用機器的各個硬體寄存器存放的有關變數的值,以減少對於內存的訪問次數。另外,如何 根據機器硬體執行指令的特點(如流水線、RISC、CISC、VLIW等)而對指令進行一些調整使目標代碼比較短,執行的效率比較高,也是一個重要的研究 課題。
經過優化得到的匯編代碼必須經過匯編程序的匯編轉換成相應的機器指令,方可能被機器執行。
4.匯編過程
匯編過程實際上指把匯編語言代碼翻譯成目標機器指令的過程。對於被翻譯系統處理的每一個C語言源程序,都將最終經過這一處理而得到相應的目標文件。目標文件中所存放的也就是與源程序等效的目標的機器語言代碼。
目標文件由段組成。通常一個目標文件中至少有兩個段:
代碼段 該段中所包含的主要是程序的指令。該段一般是可讀和可執行的,但一般卻不可寫。
數據段 主要存放程序中要用到的各種全局變數或靜態的數據。一般數據段都是可讀,可寫,可執行的。
UNIX環境下主要有三種類型的目標文件:
(1)可重定位文件 其中包含有適合於其它目標文件鏈接來創建一個可執行的或者共享的目標文件的代碼和數據。
(2)共享的目標文件 這種文件存放了適合於在兩種上下文里鏈接的代碼和數據。第一種事鏈接程序可把它與其它可重定位文件及共享的目標文件一起處理來創建另一個目標文件;第二種是動態鏈接程序將它與另一個可執行文件及其它的共享目標文件結合到一起,創建一個進程映象。
(3)可執行文件 它包含了一個可以被操作系統創建一個進程來執行之的文件。
匯編程序生成的實際上是第一種類型的目標文件。對於後兩種還需要其他的一些處理方能得到,這個就是鏈接程序的工作了。
5.鏈接程序
由匯編程序生成的目標文件並不能立即就被執行,其中可能還有許多沒有解決的問題。例如,某個源文件中的函數可能引用了另一個 源文件中定義的某個符號(如變數或者函數調用等);在程序中可能調用了某個庫文件中的函數,等等。所有的這些問題,都需要經鏈接程序的處理方能得以解決。
鏈接程序的主要工作就是將有關的目標文件彼此相連接,也即將在一個文件中引用的符號同該符號在另外一個文件中的定義連接起來,使得所有的這些目標文件成為一個能夠誒操作系統裝入執行的統一整體。
根據開發人員指定的同庫函數的鏈接方式的不同,鏈接處理可分為兩種:
(1)靜態鏈接 在這種鏈接方式下,函數的代碼將從其所在地靜態鏈接庫中被拷貝到最終的可執行程序中。這樣該程序在被執行時這些代碼將被裝入到該進程的虛擬地址空間中。靜態鏈接庫實際上是一個目標文件的集合,其中的每個文件含有庫中的一個或者一組相關函數的代碼。
(2) 動態鏈接 在此種方式下,函數的代碼被放到稱作是動態鏈接庫或共享對象的某個目標文件中。鏈接程序此時所作的只是在最終的可執行程序中記錄下共享對象的 名字以及其它少量的登記信息。在此可執行文件被執行時,動態鏈接庫的全部內容將被映射到運行時相應進程的虛地址空間。動態鏈接程序將根據可執行程序中記錄 的信息找到相應的函數代碼。
對於可執行文件中的函數調用,可分別採用動態鏈接或靜態鏈接的方法。使用動態鏈接能夠使最終的可執行文件比較 短小,並且當共享對象被多個進程使用時能節約一些內存,因為在內存中只需要保存一份此共享對象的代碼。但並不是使用動態鏈接就一定比使用靜態鏈接要優越。 在某些情況下動態鏈接可能帶來一些性能上損害。
4. 什麼是匯編程序,編譯程序,解釋程序分別說明他們的功能
程序按執行方式分為編譯和解釋兩種。
編譯就是將各種語言編寫的程序翻譯成機器語言(二進制)的過程。編譯好程序就是編譯程序。編譯程序在執行時不依靠其它程序,執行速度快。缺點是要對其修改非常麻煩,一般要將其反編譯成高級語言,修改後在編譯,往往一個程序要反復修改的話就非常麻煩。
解釋是程序在執行時外部程序進行翻譯。其特點與編譯相反,是解釋一句執行一句,這樣以來如果有大規模的程序運行會起來比較慢,而且其依靠能對其進行解釋的外部環境;但因為只在運行時才進行解釋,事先無需對整篇程序進行編譯,修改起來就比較方便。
我們非常熟悉C語言、Basic語言等就都提供編譯和解散兩種執行方式,我們可以以解釋的方式對其進行調試、修改,而把定型後的程序整篇進行編譯,以便日後執行。
再說明白些,就像一片英文報告,編譯就是把它整篇翻譯成中文後讓我們來看,解釋就是它一句一句翻譯給我們聽。
匯編語言是一種使用廣泛、功能強大基礎的編程語言(和C語言、basic語言、VC、Java等語言一樣,都是一個編程工具而且),用匯編語言編寫的程序就是匯編程序。
5. 【匯編語言】實驗5:編寫、調試具有多個段的程序
針對匯編語言實驗5,我們將依次分析並解決多個部分的問題,以幫助理解和掌握程序的編譯、鏈接、載入、調試以及段地址的相關概念。
1. 編譯、連接程序後,使用debug載入、跟蹤執行,程序返回前,data段中的數據為:23 01 56 04 89 07 BC 0A-EF 0D ED 0F BA 0C 87 09。
2. 程序執行前,CS=076C、SS=076B、DS=076A。
3. 若程序載入後,code段段地址為X,則data段段地址為X-2,stack段段地址為X-1。
4. 若題目(1)、(2)、(3)中的最後一條偽指令「end start」改為「end」,不指明程序入口,則程序仍可正確執行,前提是程序第一個段必須是代碼段。
5. 編寫程序以將a段和b段中的數據依次相加,結果存入c段。
6. 編寫程序以使用push指令將a段的前8個字型數據逆序存儲至b段。
【1】在DOSBox中輸入「d 076a:0000」查看data段數據,執行至「int 21h」後再次查看,data段數據不變。
【2】輸入指令「d 076a:0000」,執行至「int 21h」後再次查看,data段數據不變,此時DS=076A、SS=076B、CS=076C。
【3】程序中data段和stack段放至code段後,輸入「U」查看data段新地址,輸入「d 076d:0000」查看數據,執行至「int 21h」後再次查看,data段數據未變。
【4】「end start」用於指明程序入口,改為「end」時,程序需從第一個可執行段開始執行。第一題和第二題第一個段為數據段,故不正確執行;第三題第一個段為代碼段,故可正確執行。
【5】理解dw和db的區別,dw用於定義字型數據,db用於定義位元組型數據。
【6】編寫實現a段和b段相加,結果存入c段的代碼。
【代碼編寫】
參考教材:王爽《匯編語言》。
相關資源:《匯編語言》(第四版)實驗5 | Cloud_Player's Notes (cloudplayer.top)
匯編語言(王爽第三版)實驗5編寫、調試具體多個段的程序_51CTO博客_匯編語言實驗三
王爽《匯編語言》實驗五 - sail Yang's Blog (gitee.io)
6. 用C語言編的程序,要生成可執行文件的時候,要編譯、鏈接,編譯是什麼意思啊鏈接是什麼意思編譯和鏈接
編譯就是把C代碼轉換成CPU可執行的機器指令,每個.c文件生成一個.obj文件。
鏈接就是把生成的(多個) .obj 文件及用到的庫文件(.lib)一起組合生成可執行文件(.exe)。