编译器字符识别
‘壹’ 编译器 如何识别源程序是c或c++
源代码是由字符组成的吧?
明白这一点就好办了
编译器首先将你写的代码读入内存,然后寻找代码中的关键字、标识符等信息,建立一个所谓的符号表,根据这个符号表对你的源代码进行检查,检查的依据正是该语言的语法和句法规则。比如是否有变量重复定义错误、是否有类型不兼容错误,是否有遗漏语句分隔符错误等等。这些都是比较简单的,例如根据语言的关键字表可以检查是否有非法的关键字(语句分隔符之后的下一个有效字符一定是一个关键字或已定义的标识符,因此很容易识别并挑出其中的关键字进行检查),其它检查也是类似的。
检查没有问题后,编译器开始链接和映射操作(该过程在检查阶段也有使用),将你的源程序翻译成汇编程序或其它中间程序。这一步是最复杂的,因为句法和语法比较简单,但整个程序的逻辑却复杂的多,而且编译器还要负责在不改变代码原意的前提下将代码尽可能地进行优化。
最后就是将生成的汇编代码翻译为机器语言,这一步是最简单的,因为汇编只是将机器语言简单符号化而已,现在的编译理论已经能够确保将汇编代码准确地翻译为机器码了。
以上。
另外,站长团上有产品团购,便宜有保证
‘贰’ c与c++语言编译器是如何识别关键字
根据编译器的不同,有不同的识别方式,例如VC6.0使用系统内建关键字列表,如果用户定义变量的时候使用了系统默认的关键字,则会在编译的时候产生错误。
附上:
C语言的关键字共有32个,根据关键字的作用,可分其为数据类型关键字、控制语句关键字、存储类型关键字和其它关键字四类。
1 数据类型关键字(12个):
(1) char :声明字符型变量或函数
(2) double :声明双精度变量或函数
(3) enum :声明枚举类型
(4) float:声明浮点型变量或函数
(5) int: 声明整型变量或函数
(6) long :声明长整型变量或函数
(7) short :声明短整型变量或函数
(8) signed:声明有符号类型变量或函数
(9) struct:声明结构体变量或函数
(10) union:声明联合数据类型
(11) unsigned:声明无符号类型变量或函数
(12) void :声明函数无返回值或无参数,声明无类型指针(基本上就这三个作用)
(2)控制语句关键字(12个):
A循环语句
(1) for:一种循环语句(可意会不可言传)
(2) do :循环语句的循环体
(3) while :循环语句的循环条件
(4) break:跳出当前循环
(5) continue:结束当前循环,开始下一轮循环
B条件语句
(1)if: 条件语句
(2)else :条件语句否定分支(与 if 连用)
(3)goto:无条件跳转语句
C开关语句
(1)switch :用于开关语句
(2)case:开关语句分支
(3)default:开关语句中的“其他”分支
D
return :子程序返回语句(可以带参数,也看不带参数)
3 存储类型关键字(4个)
(1)auto :声明自动变量 一般不使用
(2)extern:声明变量是在其他文件正声明(也可以看做是引用变量)
(3)register:声明积存器变量
(4)static :声明静态变量
4 其它关键字(4个):
(1)const :声明只读变量
(2)sizeof:计算数据类型长度
(3)typedef:用以给数据类型取别名(当然还有其他作用
(4)volatile:说明变量在程序执行中可被隐含地改变
‘叁’ 编译器怎么区分标识符和字符
首先要清楚标识符和字符的定义
标识符是程序员自己规定的具有特定含义的单词,比如类名称,属性名称,变量名等。
举例子就是
class
string
字符是指计算机中使用的字母、数字、字和符号
举例子就是
1,2,3,abc
然后要强调,编译宴蠢器是无法区分标识符和字符的,只有人事先为其规定好规则的情况下,编译器才会按照标识符的方式去读取。打个比方,我规定了class为类标识符,那当我程序里
出现了class
test时,编译器就会认为test是类而不是字符。不知道含腊能不能理解谈祥滑,不过是个好问题
‘肆’ 在C语言中编译器是如何读取字符的
回车也是一个字符,你的问题描述的不是很清除,看来三遍还没没能完全理解,你是scanf("%d",&n);之后在while(getchar()!='\n')处停住但是程序是直接过去的是吧。
实际上呢,我们电脑上的回车键其实是两个键值:回车换行也就是\r\n,在输入字符串之后\n不一定被系统接受而被滞留在输入流里面,所以在后面想要再获得字符时正好输入缓存里有就直接接收了。所以就没等你再输入回车就执行玩了,在获得一个字符之前通常的做法是先清除缓存再获得,记得是fflush()这个函数。当然清除缓存的方法有很多不局限于此!
‘伍’ 编译器如何识别字符是关键字还是变量名的
编译过程大概分这么几步
首先用有限状态自动机把代码文本分割成一个一个的token,每个token是一个意义单位,
比如
int main(123);
就被分割成了
int
main
(
123
)
然后对token列表根据该语言的语法建立语法树,在建立语法树的过程中就要区分某个单词是关键字还是标识符(也就是变量名),一般来讲编译器一般都有一个保留字列表,开始的时候都当作变量名看待,如果发现某个变量名出现在了保留字列表里,就对其进行标识处理。
‘陆’ 为什么codeblocks识别不出转义字符
codeblocks识别不出转义字符原因:codeblocks 默认是用的g++编译器。应该是默认的编码问题。
原因code blocks默认UTF-8(无bom)字符编码。而GCC是按照ANSI字符编码来编译的。所以会出现中文乱码。解决方法是把code blocks设置成ANSI字符编码。操作是新建--在界面的右半边把字符编码选择ANSI保存。
字符型常量:
C语言中字符型常量所表示的值是int型所能包含的值。我们可以用ASCII表达式来表示一个字符型常量,或者用单引号内加反斜杠表示转义字符。
'A', 'x2f', '