當前位置:首頁 » 編程軟體 » 詞法編譯器

詞法編譯器

發布時間: 2022-01-11 03:12:06

編譯原理詞法分析器是干什麼用的,怎麼用

1、識別出源程序中的各個單詞符號,並轉換成內部編碼形式 2、刪除無用的空白字元回車字元以及其他非實質性字元 3、刪除注釋 4、進行詞法檢查,報告所發現的錯誤。

❷ 想知道編譯器和鏈接器的對C++的具體實現,但是不想知道編譯器詞法分析,語法分析等原理,應該看什麼資料

第一個問題看inside C++ object model,也就是jjhou翻譯的《深入理解C++對象模型》。可以了解到C++類的內存布局,以及虛函數等的實現,當然自己根據這些,在不同的編譯器上寫實現,進行觀察,得到實際的數據結論是最好的。
第二個問題,你所寫的應該是和VC相關的,win平台下的,可以看一些關於win PE文件的介紹文章,具體搜索PE格式你可以得到一大堆的資料

❸ 想做一個編譯器前端,非常簡單的那種,包括詞法分析,語法分析,語義,代碼生成,只要能識別像a=10;這樣的

編譯器之類的程序,寫起來不是很容易的,如果你感興趣的話,可以看看GCC,LCC之類開源代碼,裡面就有你想要的東西

給你發個鏈接吧,GCC 3.3.5的源碼
http://ftp.gnu.org/gnu/gcc/gcc-3.3.5/gcc-3.3.5.tar.gz

❹ 編譯原理中的詞法分析器的輸入與輸出是什麼

編譯原理中的詞法分析器的輸入是源程序,輸出是識別的記號流。

詞法分析器編制一個讀單詞的程序,從輸入的源程序中,識別出各個具有獨立意義的單詞,即基本保留字、標識符、常數、運算符和分隔符五大類。並依次輸出各個單詞的內部編碼及單詞符號自身值。(遇到錯誤時可顯示「Error」,然後跳過錯誤部分繼續顯示)。

(4)詞法編譯器擴展閱讀

詞法分析器的作用:

1、與符號表進行交互,存儲和讀取符號表中的標識符的信息。

2、讀入源程序的輸入字元,將他們組成詞素,生成並輸出一個詞法單元序列,每個詞法單元序列對應一個於一個詞素。

3、過濾掉程序中的注釋和空白。

4、將編譯器生成的錯誤消息與源程序的位置聯系起。


❺ 編譯器可是沒有思路.或許是我連編譯器的本質還沒搞懂吧.分為七個部分,詞法分析,語法分析等..對嗎

一般都是把源碼轉為elf,a.out,coff,omf之類格式的文件.再用連接器(或者鏈接器,反正就是linker).連接成程序(就是exe或dll之類的).
也有些是生成匯編代碼,再調用匯編器匯編成elf,a.out,coff,omf之類.再連接.
也有些是直接生成exe,dll的.
vc也是先編譯成win32格式(也說是COFF格式)的,再連接成exe,dll.

如果你想做編譯器,可以去看<<編譯原理>>之類的書.
也可以去下載一些開源的編譯器代碼來學習.
我也一直在學習編譯器的.已經有段時間了.但是還是不太清楚.
編譯原理看了大半也暈乎乎的,不知道說什麼.

❻ 求一個盡量完整的編譯器:詞法分析器+語法分析器

在一個模式被匹配之前,詞法分析器往往需要超前掃描該詞素後面的若干個字元,使用將字元退回輸入流的方法,需要移動大量字元的時間,由於 詞法分析器是編譯期間唯一需要逐一掃描源程序字元的過程,因此它的效率將極大的影響編譯器的性能,因此人們發明了雙緩沖區的技術。
雙緩沖區技術原理如下:
把一個緩沖區分成前後兩個部分,每部分能夠容納N(1024/4096)個字元,每次系統讀命令讀入N個字元到前半部分或者後半部分,如果剩餘的不足N個字元,則在最後增加一個不同於其他任何字元的字元,如eof/#,用於標識源文件的結束。緩沖區包括兩個指針beginning和forward,在兩個指針之間的字元串就是當前的詞素。一開始兩個指針都指向第一個字元,然後forward向後掃描,直至發現一個匹配的詞素為止。如果forward跨過中間標記,則往後半部分讀入N個字元。如果forward指針移過最後位置,則向前半部分讀入N個字元,且forward指針重新指向開始繼續處理過程。為了處理方便在兩個部分的最後都增加一個文件結束標識eof。示意圖如下:
______________________________________________________________________
|............for......while.... ........................................ |....int i .................................................. ...................| |_______________________________eof|_______________eof________________eof|
| |
beginning forward

下面是雙緩沖區的一個c實現:

#include <stdio.h>
#include <string.h>

#define MAXWORD 1000

struct bibuffer
{
char* buffer[2048]; //緩沖區空間
char* beginning,forward; //前向和後向指針
int count; //前向指針記數
} bbuf;

void parse(char c)
{
if(c=' ')
{
memcpy(word[i],beginning,(size_t)(forward-beginning));
i++;
}
else forward++;
}

int main(int argc,char* argv)
{
File* fp;
char* word[MAXWORD];
int i=0;
buffer=new char[2048];
fp=open("test.c","r");
read(fp,buffer,1023);
buffer[1023]='#';
read(fp,buffer+1024,1023);
buffer[2047]='#';
bbuf->buffer=buffer;
bbuf->beginning=bbuf->forward=bbuf->buffer;
bbuf->count=0;
while(1)
{
forward=forward+1;
if(count==1023)
{
read(fp,buffer+1024,1023);
forward++;
//這個函數的具體代碼就要和具體的詞法分析規則而定,這里假設只識別空格分割的單詞
parse(*forward);
}
else if(count>=2048)
{
read(fp,buffer,1023);
forward=bbuf->buffer;
//這個函數的具體代碼就要和具體的詞法分析規則而定,這里假設只識別空格分割的單詞
parse(*forward);
}
else if(count!=1023&&count<2048&&(*forward)='#')
{
break; //詞法分析結束
}
}
}

❼ 詞法分析器是什麼

詞法分析器即詞法分析程序又稱為掃描器,其功能在於依次掃視字元串形式源程序中的各個字元,逐個識別出其中的單詞,並將其轉換為內部編碼形式的單詞符號串作確為輸出。通常,可採用二元式

(class,value)

來表示一個單詞符號的內部編碼,其中:class為一整數碼,用於表示該單詞的類別;value則是該單詞之值(如變數名在符號表中序號,常數的二進製表示,以及運算符和分隔符的編碼等等)。

概括地說,掃描器在其工作過程中,一般應完成下列的任務:

(1)識別出源程序中的各個單詞符號,並將其轉換為內部編碼形式;

(2)刪除無用的空白字元、回車字元以及其它非實質性字元;

(3)刪除注釋;

(4)進行詞法檢查,報告所發現的錯誤。

此外,視編譯工作流程的組織,一些編譯程序在進行詞法分析時,還要完成將所識別出的標識符登錄到符號表的工作。

詞法分析工作在詞法規則的控制下進行。用來描述程序設計語言詞法的手段通常有三種,即正規文法、有限自動機和正規式。

❽ 一般設計編譯器要將詞法分析和語法分析分開的原因是什麼

  1. 簡單性——詞法分析技術不如語法分析技術技術復雜,分開之後詞法分析過程更簡單。(這里還有一些意思差不多的話)

  2. 效率——詞法分析佔用的時間是整個編譯時間的一大部分,所以將它們分開有利於優化詞法分析,而提高編譯效率

  3. 可移植性——詞法分析通常平台相關,語法分析器可以是平台無關的。分開了對移植有利。


(引自《程序設計語言概念》(第9版) Sebesta著)

❾ 編譯原理課程設計-詞法分析器設計(C語言)

#include"stdio.h"/*定義I/O庫所用的某些宏和變數*/

#include"string.h"/*定義字元串庫函數*/

#include"conio.h"/*提供有關屏幕窗口操作函數*/

#include"ctype.h"/*分類函數*/

charprog[80]={''},

token[8];/*存放構成單詞符號的字元串*/

charch;

intsyn,/*存放單詞字元的種別碼*/

n,

sum,/*存放整數型單詞*/

m,p;/*p是緩沖區prog的指針,m是token的指針*/

char*rwtab[6]={"begin","if","then","while","do","end"};

voidscaner(){

m=0;

sum=0;

for(n=0;n<8;n++)

token[n]='';

ch=prog[p++];

while(ch=='')

ch=prog[p++];

if(isalpha(ch))/*ch為字母字元*/{

while(isalpha(ch)||isdigit(ch))/*ch為字母字元或者數字字元*/{

token[m++]=ch;

ch=prog[p++];}

token[m++]='';

ch=prog[p--];

syn=10;

for(n=0;n<6;n++)

if(strcmp(token,rwtab[n])==0)/*字元串的比較*/{

syn=n+1;

break;}}

else

if(isdigit(ch))/*ch是數字字元*/{

while(isdigit(ch))/*ch是數字字元*/{

sum=sum*10+ch-'0';

ch=prog[p++];}

ch=prog[p--];

syn=11;}

else

switch(ch){

case'<':m=0;token[m++]=ch;ch=prog[p++];

if(ch=='>'){

syn=21;

token[m++]=ch;}

elseif(ch=='='){

syn=22;

token[m++]=ch;}

else{

syn=20;

ch=prog[p--];}

break;

case'>':m=0;token[m++]=ch;ch=prog[p++];

if(ch=='='){

syn=24;

token[m++]=ch;}

else{

syn=23;

ch=prog[p--];}

break;

case':':m=0;token[m++]=ch;ch=prog[p++];

if(ch=='='){

syn=18;

token[m++]=ch;}

else{

syn=17;

ch=prog[p--];}

break;

case'+':syn=13;token[0]=ch;break;

case'-':syn=14;token[0]=ch;break;

case'*':syn=15;token[0]=ch;break;

case'/':syn=16;token[0]=ch;break;

case'=':syn=25;token[0]=ch;break;

case';':syn=26;token[0]=ch;break;

case'(':syn=27;token[0]=ch;break;

case')':syn=28;token[0]=ch;break;

case'#':syn=0;token[0]=ch;break;

default:syn=-1;}}

main()

{

printf(" Thesignificanceofthefigures: "

"1.figures1to6saidKeyword "

"2. "

"3.figures13to28saidOperators ");

p=0;

printf(" pleaseinputstring: ");

do{

ch=getchar();

prog[p++]=ch;

}while(ch!='#');

p=0;

do{

scaner();

switch(syn){

case11:printf("(%d,%d) ",syn,sum);break;

case-1:printf(" ERROR; ");break;

default:printf("(%d,%s) ",syn,token);

}

}while(syn!=0);

getch();

}

程序測試結果

對源程序beginx:=9:ifx>9thenx:=2*x+1/3;end#的源文件,經過詞法分析後輸出如下圖5-1所示:

具體的你在修改修改吧

❿ 詞法分析器是編譯器中掃描什麼的部分

詞法分析器是編譯器中掃描字元和單詞的部分。

通常,可採用二元式來表示一個單詞符號的內部編碼,其中:class為一整數碼,用於表示該單詞的類別;value則是該單詞之值(如變數名在符號表中序號,常數的二進製表示,以及運算符和分隔符的編碼等等)。

在分析時

一是把詞法分析器當成語法分析的一部分,另一種是把詞法分析器當成編譯程序的獨立部分。在前一種情況下,詞法分析器不斷地被語法分析器調用,每調用一次詞法分析器將從源程序的字元序列拼出一個單詞,並將其Token值返回給語法分析器。後一種情況則不同,詞法分析器不是被語法分析器不斷地調用,而是一次掃描全部單詞完成編譯器的獨立一遍任務。

熱點內容
smsforandroid 發布:2024-11-13 09:20:22 瀏覽:675
如何查找公司郵件伺服器與埠 發布:2024-11-13 08:55:12 瀏覽:530
pythonrequests文件 發布:2024-11-13 08:52:27 瀏覽:222
速騰安卓大屏什麼牌子好 發布:2024-11-13 08:49:59 瀏覽:664
黑岩上傳 發布:2024-11-13 08:49:18 瀏覽:33
Python高清 發布:2024-11-13 08:41:20 瀏覽:737
阿里雲伺服器很慢 發布:2024-11-13 08:29:27 瀏覽:720
老年公寓項目醫療怎麼配置 發布:2024-11-13 07:58:24 瀏覽:948
破解加密視頻的工具 發布:2024-11-13 07:40:37 瀏覽:94
java對日 發布:2024-11-13 07:26:44 瀏覽:191