編譯原理詞法分析實驗報告

發布時間: 2025-02-21 00:57:50

A. 詞法分析和語法分析區別

詞法分析和語法分析是編譯原理中的兩個重要概念，它們在編譯過程中扮演不同的角色。
1. 詞法分析（Lexical Analysis）：詞法分析是編譯器的第一階段，也稱為掃描（Scanning）或詞法掃描（Tokenization）。它的主要任務是將源代碼轉化為一個個的詞法單元（Token）。詞法單元是具有獨立含義的字元序列，比如關鍵字、標識符、數字常量、運算符等。詞法分析器根據事先定義好的詞法規則（正則表達式或有限狀態自動機）對源代碼進行掃描和識別，生成詞法單元流作為後續語法分析的輸入。
2. 語法分析（Syntax Analysis）：語法分析是編譯器的第二階段，也稱為解析（Parsing）。它的主要任務是根據語法規則分析詞法單元流，確定語法結構，並構建對應的語法樹（Parse Tree）或抽象語法樹（Abstract Syntax Tree）。語法規則通常使用上下文無關文法的巴科斯-諾爾範式（BNF）。語法分析器通過遞歸下降、LR分析等演算法，從詞法單元流中識別語法結構，並進行相應的語法規約和移進操作，最終得到語法樹或者抽象語法樹。
總結而言，詞法分析關注於單詞的識別和分類，將源代碼切分為有意義的詞法單元；而語法分析則關注於將詞法單元通過語法規則組織起來，構建出語法結構。兩者相互配合，是編譯過程中的重要組成部分，並且是後續語義分析和代碼生成的基礎。

B. 編譯原理詞法分析實驗中，文件寫入順序的問題(fputs)

1)fopen在代碼中出現2次，沒有必要

2）你的程序不對你搞混和S這個字元和TOKEN。

你的第一個WHILE讀入的是字元S，而TOKEN是由若干字元S構成的。而你的SWITCH(S)裡面按理應該是組成TOKEN的規則，而你直接就輸出了。這樣如果你要結果，我給你改了下，你看下：

int main()
{
char token[20] = {''};
char s;
char strings[10] = "(34,_)";
struct _iobuf* fp_cifa;
int i = 0, j;
strings[6] = ' '
strings[7] = ''
//fp_cifa = fopen(「D:\cifa.txt "a+");

while((size_t)i != strlen(file))
{
for(j = 0; j < 20; j++)
{
token[j] = ''
}
s = file[i++];
while(s == ' ' || s == ' ')
{
s = file[i++];
}
switch(s)
{
caseƇ':
token[0]=s;
token[1]=''
digitprint(token, value_num, num_list);
break;
case'=':
token[0]=s;
token[1]=''
digitprint(token, value_num, num_list);
//fputs(strings, fp_cifa);
break;
default:
cout<<"error"<<endl;
}
}
//fclose(fp_cifa);
return 0;
}

void digitprint(char* a, int& value_num_, char num_list[100][20])//a是需要評定的字元串//num在符號表中的位置，需要轉化為字元串然後輸入到文件中
{
FILE* fp_cifa;
char c[20] = "(34,01)";
fp_cifa = fopen("D:\cifa.txt ", "a+");
//fputs(c, fp_cifa);
fputs(a,fp_cifa);//這里要顯示 a 而不是c 你可以把a 拼到 c然後，再顯示c
fclose(fp_cifa);
}

C. 急（高懸賞幫個忙）求編譯原理課程設計---c語言實現c-的語法分析，在線等

新建一個文本文檔在你工程目錄下，名字起為"輸入.txt",裡面的內容可以為
begin a:=1+7*(6+3);b:=1end#

輸出是在"輸出.txt"中查看，以下為輸出情況：

詞法分析結果如下:
(1, begin)
(10, a)
(18, :=)
(11, 1)
(13, +)
(11, 7)
(15, *)
(27, ()
(11, 6)
(13, +)
(11, 3)
(28, ))
(26, ;)
(10, b)
(18, :=)
(11, 1)
(6, end)
(0, #)
語法分析結果如下:（以四元式形式輸出）
( +, 6, 3, t1)

( *, 7, t1, t2)

( +, 1, t2, t3)

( =, t3, __, a)

( =, 1, __, b)

//提供一個編譯原理的語義分析程序你可以直接復制用TC進行調試
#include "stdio.h"
#include "string.h"
#include <malloc.h>
#include <conio.h>
#include "stdlib.h"

char prog[100],token[8],ch;
char *rwtab[6]={"begin","if","then","while","do","end"};
int syn,p,m,n,sum,q;
int kk;
//四元式表的結構如下：
struct
{
char result1[8];
char ag11[8];
char op1[8];
char ag21[8];
}quad[20];

char *factor();
char *expression();
int yucu();
char *term();
int statement();
int lrparser();
char *newtemp();
void scaner();
void emit(char *result,char *ag1,char *op,char *ag2);

void main()
{
FILE *fp1,*fp2;

if((fp1=fopen("輸入.txt","rt"))==NULL)
{
printf("Cannot open 輸入.txt\n");
getch();
exit(1);
}
if((fp2=fopen("輸出.txt","wt+"))==NULL)
{
printf("Cannot create 輸出.txt FILE.strike any key exit");
getch();
exit(1);
}

int j;
q=p=kk=0;
p=0;
//printf("Please Input a String(end with '#'):\n");
while(ch!='#')
{
ch = fgetc(fp1);
if(ch == EOF)
{
printf("文件為空，請檢查後再嘗試!");
return ;
}

prog[p++]=ch;
}
if(prog[p]=='#')
{
printf("輸入的待分析的串不是以'#'結尾,請修改之後再嘗試!\n");
return;
}
p=0;
char buffer1[200] = {0};
sprintf(buffer1,"詞法分析結果如下:\n");
fputs(buffer1,fp2);
//printf("詞法分析結果如下:\n");
do
{
scaner();
switch(syn)
{
case 11:
//printf("(%d,%d)\n",syn,sum);
sprintf(buffer1,"(%d, %d) \n",syn,sum);
fputs(buffer1,fp2);
break;
default:
//printf("(%d,%s)\n",syn,token);
sprintf(buffer1,"(%d, %s)\n",syn,token);
fputs(buffer1,fp2);
break;
}
}while(syn!=0);
printf("\n");

p=0;
char buffer[200]={0};
sprintf(buffer,"語法分析結果如下:（以四元式形式輸出）\n");
fputs(buffer,fp2);
//printf("語法分析結果如下:（以四元式形式輸出）\n");
scaner();//掃描函數
lrparser();
if(q>19)
printf(" to long sentense!\n");
else
{

for (j=0;j<q;j++)
{
//printf("( %s, %s, %s, %s) \n\n",quad[j].op1,quad[j].ag11,quad[j].ag21,quad[j].result1);
sprintf(buffer,"( %s, %s, %s, %s) \n\n",quad[j].op1,quad[j].ag11,quad[j].ag21,quad[j].result1);
fputs(buffer,fp2);
}
}
printf("已把相應的詞法和語法的結果保存到相應的文件中，請查閱!\n");
fclose(fp1);
fclose(fp2);
}
int lrparser()
{
int schain=0;
kk=0;
if (syn==1) //得到begin
{
scaner();//掃描下個字元
schain=yucu();
if(syn==6)//得到end
{
scaner();//掃描下個字元
if((syn==0)&&(kk==0)) //得到#
printf("Success!\n");
}
else
{
if(kk!=1)
printf("short of 'end' !\n");
kk=1;
getch();
exit(0);
}
}
else
{
printf("short of 'begin' !\n");
kk=1;
getch();
exit(0);
}
return (schain);
}
int yucu()
{
int schain=0;
schain=statement();
while(syn==26)
{
scaner();
schain=statement();
}
return (schain);
}
int statement()
{
char tt[8],eplace[8];
int schain=0;
if (syn==10)
{
strcpy(tt,token); //tt中保存的是第一個字元
scaner();
if(syn==18) //檢測到=號
{
scaner();
strcpy(eplace,expression());
emit(tt,eplace,"=","__");
schain=0;
}
else
{
printf("short of sign ':=' !\n");
kk=1;
getch();
exit(0);
}
return (schain);
}
}
char *expression()
{
char *tp,*ep2,*eplace,*tt;
tp=(char *)malloc(12);
ep2=(char *)malloc(12);
eplace=(char *)malloc(12);
tt=(char *)malloc(12);

strcpy(eplace,term());

while((syn==13)||(syn==14))
{
if (syn==13)
strcpy(tt,"+");
else
strcpy(tt,"-");

scaner();
strcpy(ep2,term());
strcpy(tp,newtemp());
emit(tp,eplace,tt,ep2);
strcpy(eplace,tp);
}
return (eplace);
}
char *term()
{
char *tp,*ep2,*eplace,*tt;
tp=(char *)malloc(12);
ep2=(char *)malloc(12);
eplace=(char *)malloc(12);
tt=(char *)malloc(12);

strcpy(eplace,factor());

while((syn==15)||(syn==16))
{
if (syn==15)
strcpy(tt,"*");
else
strcpy(tt,"/");
scaner();
strcpy(ep2,factor());
strcpy(tp,newtemp());
emit(tp,eplace,tt,ep2);
strcpy(eplace,tp);
}
return (eplace);
}
char *factor()
{
char *fplace;
fplace=(char *)malloc(12);
strcpy(fplace,"");

if(syn==10) //得到字元
{
strcpy(fplace,token);
scaner();
}
else if(syn==11) //得到數字
{
itoa(sum,fplace,10);
scaner();
}
else if(syn==27) //得到)
{
scaner();
fplace=expression();
if(syn==28) //得到(
scaner();
else
{
printf("error on ')' !\n");
kk=1;
getch();
exit(0);
}
}
else
{
printf("error on '(' !\n");
kk=1;
getch();
exit(0);
}
return (fplace);
}
//該函數回送一個新的臨時變數名，臨時變數名產生的順序為T1,T2...
char *newtemp()
{
char *p;
char m[8];
p=(char *)malloc(8);

kk++;
itoa(kk,m,10);
strcpy(p+1,m);
p[0]='t';
return(p); //設置中間變數名放在一個字元數組中，字元數組的第一個字元為t第二個字元為m表示的數值
}
void scaner()
{
sum=0;
///for(m=0;m<8;m++)
//token[m++]=NULL;
memset(token,0,8);
m=0;
ch=prog[p++];
while(ch==' ')
ch=prog[p++];
if(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A')))
{
while(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A'))||((ch>='0')&&(ch<='9')))
{
token[m++]=ch;
ch=prog[p++];
}
p--;
syn=10;
token[m++]='\0';
for(n=0;n<6;n++)
if(strcmp(token,rwtab[n])==0)
{
syn=n+1;
break;
}
}
else if((ch>='0')&&(ch<='9'))
{
while((ch>='0')&&(ch<='9'))
{
sum=sum*10+ch-'0';
ch=prog[p++];
}
p--;
syn=11;
}
else switch(ch)
{
case '<':m=0;
ch=prog[p++];
if(ch=='>')
{
syn=21;
}
else if(ch=='=')
{
syn=22;
}
else
{
syn=20;
p--;
}
break;
case '>':m=0;
ch=prog[p++];
if(ch=='=')
{
syn=24;
}
else
{
syn=23;
p--;
}
break;
case ':':m=0;
token[m++] = ch;
ch=prog[p++];
if(ch=='=')
{
syn=18;
token[m++] = ch;
}
else
{
syn=17;
p--;
}
break;

case '+': syn=13;token[0] = ch; break;
case '-': syn=14;token[0] = ch; break;
case '*': syn=15;token[0] = ch;break;
case '/': syn=16;token[0] = ch;break;
case '(': syn=27;token[0] = ch;break;
case ')': syn=28;token[0] = ch;break;
case '=': syn=25;token[0] = ch;break;
case ';': syn=26;token[0] = ch;break;
case '#': syn=0;token[0] = ch;break;
default: syn=-1;break;
}
}
//該函數是生成一個三地址語句送到四元式表中
void emit(char *result,char *ag1,char *op,char *ag2)
{
strcpy(quad[q].result1,result);
strcpy(quad[q].ag11,ag1);
strcpy(quad[q].op1,op);
strcpy(quad[q].ag21,ag2);
q++; //統計有多少個四元式
}

D. 編譯原理中詞法分析和語法分析的任務分別是什麼

詞法分析的主要任務是將源代碼轉換為一系列有意義的詞彙單位，這個過程可以分解字元序列形成單片語合，我們稱之為詞法單元或記號。在詞法分析中，分析器識別關鍵字、標識符、常量和運算符等元素，形成一個詞法單元序列。

語法分析的任務是根據預設的語法規則，分析詞法單元序列的結構。這一步驟旨在判斷序列是否遵循既定的語法規則。語法分析器通過構建語法樹或語法分析樹，展示源代碼的結構。在此過程中，語法分析器還會檢測語法錯誤，並生成相應的錯誤信息。

詞法分析與語法分析是編譯原理中的兩個關鍵環節，它們共同協作完成源代碼的分析和轉換。詞法分析將源代碼轉換為詞法單元序列，為後續的語法分析提供數據輸入。而語法分析則依據語法規則對詞法單元序列進行深入分析，判斷其是否符合語法規則。經過這兩個步驟，編譯器能夠對源代碼進行更深層次的語義分析、優化，並最終生成目標代碼。

E. 編譯原理中的詞法分析需要進行錯誤報告嗎

詞法分析中需要進行處理和報告的錯誤為：源程序中出現的不符合文法的字元，標識符等等。
這些一定要在詞法分析中完成，擱到後面會很麻煩。
其餘錯誤，如類型不匹配，返回值出錯，語句語法錯誤等，在語法分析過程中進行。

F. 編譯原理簡單嗎

編譯原理主要是講了編譯器的實現。
那什麼是編譯器呢？
編譯器就是將源程序→編譯器 →目標機器代碼的程序
本文將用一段最簡單的代碼進行說明

1 + 2 + 3

第一步. 詞法分析
當代碼從文件中被讀入到編輯器時，將會進行詞法分析
示例中的代碼最終會轉換為(下面為偽代碼)

1 ADD 2 ADD 3

第二步. 語法分析
這一步編譯器將會把詞法分析的結果轉換成AST(abstract syntax tree, 抽象語法樹)
所有的操作數將會作為子節點，所有的操作符將會作為父節點。(不知道的同學可以看一下樹的生成)

1 + 2 + 3 對應的樹
3. 生成目標代碼
對上面的樹進行後序遍歷，將會得到下面的偽代碼

((1 2 +) 3 +)

生成的匯編偽代碼為

START:

MOV VALUE, 0//初始化結果為0

ADD VALUE, 1

ADD VALUE, 2//(1 2 +)的匯編偽代碼

ADD VALUE, 3

RET VALUE

END

最終匯編代碼會被編譯成機器代碼，在計算機上執行。
下面為一般情況下的編譯流程
1. 詞法分析(生成代碼對應的token序列，使用正則表達式)
2. 語法分析(生成AST)
3. 語義分析(對代碼的語法進行檢查)
4. 代碼生成(生成可執行的代碼)

閱讀全文

熱點內容

scratch少兒編程課程發布：2025-04-16 17:11:44 瀏覽：642

榮耀x10從哪裡設置密碼發布：2025-04-16 17:11:43 瀏覽：369

java從入門到精通視頻發布：2025-04-16 17:11:43 瀏覽：89

php微信介面教程發布：2025-04-16 17:07:30 瀏覽：312

android實現陰影發布：2025-04-16 16:50:08 瀏覽：795

粉筆直播課緩存發布：2025-04-16 16:31:21 瀏覽：348

機頂盒都有什麼配置發布：2025-04-16 16:24:37 瀏覽：213

編寫手游反編譯都需要學習什麼發布：2025-04-16 16:19:36 瀏覽：819

proteus編譯文件位置發布：2025-04-16 16:18:44 瀏覽：369

土壓縮的本質發布：2025-04-16 16:13:21 瀏覽：596

編譯原理詞法分析實驗報告

與編譯原理詞法分析實驗報告相關的資訊