程序员编译

发布时间: 2023-09-06 07:38:20

① c/c 语言编译程序的首要工作是

答案是A

C/C++程序编译过程包括下面4个阶段：
1.预处理，
2.编译，
3.汇编，
4.链接。

下面我们就来详细分析下这几个阶段。

1.预处理
预处理相当于根据预处理指令组装新的C/C++程序。经过预处理，
会产生一个没有宏定义，没有条件编译指令，没有特殊符号的输出文件，
这个文件的含义同原本的文件无异，只是内容上有所不同。

读取C/C++源程序，对其中的伪指令（以#开头的指令）进行处理
①将所有的“#define”删除，并且展开所有的宏定义
②处理所有的条件编译指令，如：“#if”、“#ifdef”、“#elif”、“#else”、“endif”等。
这些伪指令的引入使得程序员可以通过定义不同的宏来决定编译程序对哪些代码进行处理。
预编译程序将根据有关的文件，将那些不必要的代码过滤掉。
③处理“#include”预编译指令，将被包含的文件插入到该预编译指令的位置。
（注意：这个过程可能是递归进行的，也就是说被包含的文件可能还包含其他文件）
删除所有的注释
添加行号和文件名标识。
以便于编译时编译器产生调试用的行号信息及用于编译时产生的编译错误或警告时能够显示行号
保留所有的#pragma编译器指令

2.编译
将预处理完的文件进行一系列词法分析、语法分析、语义分析及优化后，产生相应的汇编代码文件。

3.汇编
将编译完的汇编代码文件翻译成机器指令，并生成可重定位目标程序的.o文件，该文件为二进制文件，字节编码是机器指令。
汇编器是将汇编代码转变成机器可以执行的指令，每一个汇编语句几乎都对应一条机器指令。
所以汇编器的汇编过程相对于编译器来讲比较简单，它没有复杂的语法，也没有语义，也不需要做指令优化，
只是根据汇编指令和机器指令的对照表一一翻译即可。

4.链接
通过链接器将一个个目标文件（或许还会有库文件）链接在一起生成一个完整的可执行程序。
由汇编程序生成的目标文件并不能立即就被执行，其中可能还有许多没有解决的问题。

例如，某个源文件中的函数可能引用了另一个源文件中定义的某个符号（如变量或者函数调用等）；
在程序中可能调用了某个库文件中的函数，等等。所有的这些问题，都需要经链接程序的处理方能得以解决。
链接程序的主要工作就是将有关的目标文件彼此相连接，也就是将在一个文件中引用的符号同该符号在另外
一个文件中的定义连接起来，使得所有的这些目标文件成为一个能够被操作系统装入执行的统一整体。
至此，大致经过这几个步骤，一个完整的可执行程序产生了。

② 小白求助，编译是什么，为什么需要编译

人与机器交流（即人让计算机按照人的意愿做事）依赖于语言
语言的层次是：自然语言->高级编程语言->汇编语言->机器码
人最熟悉的肯定是自然语言（就是你平时说的话）。
而计算机的cpu只认识二进制的机器码，机器码指导计算机做什么操作（如逻辑运算）。
高级编程语言跟自然语言的关系更近些，对人来说相当于自然语言的白痴版，如java中的对象与类的概念可能对应于现实世界的某种事物，如C语言中的函数可能对应了一个功能，比如打印文件，经过简单的训练，人也能大概的读懂。
汇编语言和机器码更接近些，每个汇编指令一般都会对应一条机器码，而高级编程语言中的一个语句（如if else什么的）可能会对应多条汇编指令，汇编指令一般就是算术运算（如add）、逻辑运算（如and）、数据传送（如mov）、条件判断、跳转等，只能用这些简单功能的汇编指令组合来完成一个复杂的功能。人看懂汇编就很吃力了，更别提用汇编来完成想要的功能，太吃力，这个过程还是交个编译器比较好。
而机器码对于一般的程序员来说，就是天书，也基本没人愿意去看。
自然语言最容易表述人们的要求，当用户用自然语言表述了需要的功能后，从自然语言到高级语言的转换过程由程序员来完成，而由高级编程语言到汇编、由汇编到机器码的过程都由编译器来完成，由编译器完成的这个过程也就是编译了。
高级编程语言的代码经过编译阶段成为汇编代码，汇编代码经过汇编阶段变成机器码，机器码文件经过链接阶段变成可执行文件（.exe）。一般编译是指的编译阶段和汇编阶段的组合，编译器的工作一般是编译和链接。
这就是我的理解，希望你帮到你。

③ 如何防止程序员反编译

Java从诞生以来，其基因就是开放精神，也正因此，其可以得到广泛爱好者的支持和奉献，最终很快发展壮大，以至于有今天之风光！但随着java的应用领域越来越广，特别是一些功能要发布到终端用户手中（如Android开发的app），有时候，公司为了商业技术的保密考虑，不希望这里面的一些核心代码能够被人破解（破解之后，甚至可以被简单改改就发布出去，说严重点，就可能会扰乱公司的正常软件的市场行为），这时候就要求这些java代码不能够被反编译。

这里要先说一下反编译的现象。因为java一直秉持着开放共享的理念，所以大家也都知道，我们一般共享一个自己写的jar包时，同时会共享一个对应的source包。但这些依然与反编译没有什么关系，但java的共享理念，不只是建议我们这样做，而且它自己也在底层上“强迫”我们这么做！在java写的.java文件后，使用javac编译成class文件，在编译的过程，不像C/C++或C#那样编译时进行加密或混淆，它是直接对其进行符号化、标记化的编译处理，于是，也产生了一个逆向工程的问题：可以根据class文件反向解析成原来的java文件！这就是反编译的由来。

但很多时候，有些公司出于如上述的原因考虑时，真的不希望自己写的代码被别人反编译，尤其是那些收费的app或桌面软件（甚至还有一些j2ee的wen项目）！这时候，防止反编译就成了必然！但前面也说过了，因为开放理念的原因，class是可以被反编译的，那现在有这样的需求之后，有哪些方式可以做到防止反编译呢？经过研究java源代码并进行了一些技术实现（结果发现，以前都有人想到过，所以在对应章节的时候，我会贴出一些写得比较细的文章，而我就简单阐述一下，也算偷个懒吧），我总共整理出以下这几种方式：

代码混淆

这种方式的做法正如其名，是把代码打乱，并掺入一些随机或特殊的字符，让代码的可读性大大降低，“曲线救国”似的达到所谓的加密。其实，其本质就是打乱代码的顺序、将各类符号（如类名、方法名、属性名）进行随机或乱命名，使其无意义，让人读代码时很累，进而让人乍一看，以为这些代码是加过密的！

由其实现方式上可知，其实现原理只是扰乱正常的代码可读性，并不是真正的加密，如果一个人的耐心很好，依然可以理出整个程序在做什么，更何况，一个应用中，其核心代码才是人们想去了解的，所以大大缩小了代码阅读的范围！

当然，这种方式的存在，而且还比较流行，其原因在于，基本能防范一些技术人员进行反编译（比如说我，让我破解一个混淆的代码，我宁愿自己重写一个了）！而且其实现较为简单，对项目的代码又无开发上的侵入性。目前业界也有较多这类工具，有商用的，也有免费的，目前比较流行的免费的是：proguard（我现象临时用的就是这个）。

上面说了，这种方式其实并不是真正加密代码，其实代码还是能够被人反编译（有人可能说，使用proguard中的optimize选项，可以从字节流层面更改代码，甚至可以让JD这些反编译软件可以无法得到内容。说得有点道理，但有两个问题：1、使用optimize对JDK及环境要求较高，容易造成混淆后的代码无法正常运行；2、这种方式其实还是混淆，JD反编译有点问题，可以有更强悍的工具，矛盾哲学在哪儿都是存在的^_^）。那如何能做到我的class代码无法被人反编译呢？那就需要我们下面的“加密class”！

加密class

在说加密class之前，我们要先了解一些java的基本概念，如：ClassLoader。做java的人已经或者以后会知道，java程序的运行，是类中的逻辑在JVM中运行，而类又是怎么加载到JVM中的呢（JVM内幕之类的，不在本文中阐述，所以点到为止）？答案是：ClassLoader。JVM在启动时是如何初始化整个环境的，有哪些ClassLoader及作用是什么，大家可以自己问度娘，也不在本文中讨论。

让我们从最常见的代码开始，揭开一下ClassLoader的一点点面纱！看下面的代码：

Java代码

publicclassDemo{
publicstaticvoidmain(String[]args){
System.out.println(“helloworld!”);
}
}

上面这段代码，大家都认识。但我要问的是：如果我们使用javac对其进行编译，然后使用java使其运行（为什么不在Eclipse中使用Runas功能呢？因为Eclipse帮我们封闭，从而简化了太多东西，使我们忽略了太多的底层细节，只有从原始的操作上，我们才能看到本质），那么，它是怎么加载到JVM中的？答案是：通过AppClassLoader加载的（相关知识点可以参考：http://hxraid.iteye.com/blog/747625）！如果不相信的话，可以输出一下System.out.println(Thread.currentThrea().getContextLoader());看看。

那又有一个新的问题产生了：ClassLoader又是怎样加载class的呢？其实，AppClassLoader继承自java.lang.ClassLoader类，所以，基本操作都在这个类里面，让我们直接看下面这段核心代码吧：

看到这里，已经没有必要再往下面看了（再往下就是native方法了，这是一个重大伏笔哦），我们要做的手脚就在这里！

手脚怎么做呢？很简单，上面的代码逻辑告诉我们，ClassLoader只是拿到class文件中的内容byte[]，然后交给JVM初始化！于是我们的逻辑就简单了：只要在交给JVM时是正确的class文件就行了，在这之前是什么样子无所谓！所以，我们的加密的整个逻辑就是：

在编译代码时（如使用ant或maven），使用插件将代码进行加密（加密方式自己选），将class文件里面的内容读取成byte[]，然后进行加密后再写回到class文件（这时候class文件里面的内容不是标准的class，无法被反编译了）
在启动项目代码时，指定使用我们自定义的ClassLoader就行了，而自定义的部分，主要就是在这里做解密工作！

如此，搞定！以上的做法比较完整的阐述，可以仔细阅读一下这篇文章：https://www.ddtsoft.com/#developerworks/cn/java/l-secureclass/文章中的介绍。

通过这个方法貌似可以解决代码反编译的问题了！错！这里有一个巨大的坑！因为我们自定义的ClassLoader是不能加密的，要不然JVM不认识，就全歇菜了！如果我来反编译，呵呵，我只要反编译一下这个自定义的ClassLoader，然后把里面解密后的内容写到指定的文件中保存下来，再把这个加了逻辑的自定义ClassLoader放回去运行，你猜结果会怎样？没错，你会想死！因为你好不容易想出来的加密算法，结果人家根本不需要破解，直接就绕过去了！

现在，让我们总结一下这个方法的优缺点：实现方式简单有效，同时对代码几乎没有侵入性，不影响正常开发与发布。缺点也很明显，就是很容易被人破解！

当然啦，关于缺点问题，你也可以这么干：先对所有代码进行混淆、再进行加密，保证：1、不容易找到我们自定义的那个ClassLoader；2、就算找到了，破解了，代码可读性还是很差，让你看得吐血！（有一篇文章，我觉得写得不错，大家可以看一看：http://www.scjgcj.com/#blog/851544）

嗯，我觉得这个方法很好，我自己也差点被这个想法感动了，但是，作为一个严谨的程序员，我真的不愿意留下一个隐患在这里！所以，我继续思索！

高级加密class

前面我们说过有个伏笔来着，还记得吧？没错，就是那个native！native定义的方法是什么方法？就是我们传说中的JNI调用！前面介绍过的有一篇文章中提到过，其实jvm的真实身份并不是java，而是c++写的jvm.dll（windows版本下），java与dll文件的调用就是通过JNI实现的！于是，我们就可以这样想：JNI可以调用第三方语言的类库，那么，我们可不可以把解密与装载使用第三方语言写（如C++，因为它们生成的库是不好反编译的），这样它可以把解密出来的class内容直接调jvm.dll的加载接口进行初始化成class，再返回给我们的ClassLoader？这样，我们自定义的ClassLoader只要使用JNI调用这个第三方语言写的组件，整个解密过程，都在黑盒中进行，别人就无从破解了！

嗯，这个方法真的很不错的！但也有两个小问题：1.使用第三方语言写，得会第三方语言，我说的会，是指很溜！2.对于不同的操作系统，甚至同一操作系统不同的版本，都可能要有差异化的代码生成对应环境下的组件（如window下是exe，linux是so等）！如果你不在乎这两个问题，我觉得，这个方式真的挺不错的。但对于我来说，我的信条是，越复杂的方式越容易出错！我个人比较崇尚简洁的美，所以，这个方法我不会轻易使用！

对了，如果大家觉得这个方法还算可行的话，可以推荐一个我无意中看到的东西给大家看看（我都没有用过的）：jinstall，

更改JVM

看到这个标题，我想你可能会震惊。是的，你没看错，做为一个程序员，是应该要具有怀疑一切、敢想敢做的信念。如果你有意留心的话，你会发现JVM版本在业界其实也有好几个版本的，如：Sun公司的、IBM的、Apache的、Google的……

所以，不要阻碍自己的想象力，现在没有这个能力，并不代表不可能。所以，我想到，如果我把jvm改了，在里面对加载的类进行解密，那不就可以了吗？我在设计构思过程中，突然发现：人老了就是容易糊涂！前面使用第三方语言实现解密的两个问题，正好也是更改JVM要面对的两个问题，而且还有一个更大的问题：这个JVM就得跟着这个项目到处走啊！

④ C中程序员能否看到预编译过程和编译过程

gcc -C -E input -I header-path -o output

-E：主要选项，gcc 使用该参数生成预编译文件；
-C：进行字符串替换时保留注释；
input：源文件—— xxx.c；
header-path：源文件包含的头文件的路径，特别指以双引号形式（#include "header.h"）的包含；
-o：输出到文件；
output：存储输出的文件名。

⑤ C语言程序编译时程序中的注释部分是否参加编译

可以参加。所谓注释，便是用自然语言对源代码中某些语句或方法进行说明。并且注释的内容不会被编译器编译。可以在源代码中添加任何想要添加的说明。

注释可以出现在代码中的任何位置，用来向用户提示或解释代码的含义。程序编译时，会忽略注释，不做任何处理，就好像它不存在一样。

如需要注释的内容比较多，一行写不完，如果在每一行注释中都使用//。当然这种方法比较繁琐，看起来页面也不够简洁。这时候，就需要用到多行注释。多行注释还有一种不够简洁的注释方式，那就是嵌套在代码语句中。

(5)程序员编译扩展阅读

使用注释的例子的源代码

源世界整理，www.yuanshijie.top

#include <stdio.h>

int main()

{

/* puts 会在末尾自动添加换行符 */

puts("http://www.yuanshijie.top");

printf("源世界博客 "); //printf要手动添加换行符

return 0;

阅读全文

热点内容

服务器关闭怎么补偿发布：2025-03-12 01:01:26 浏览：332

c语言复数的四则运算发布：2025-03-12 01:01:22 浏览：802

我的世界电脑版新的服务器发布：2025-03-12 01:00:27 浏览：378

网站数据库设置发布：2025-03-12 00:52:13 浏览：310

安卓是哪个企业发布：2025-03-12 00:41:23 浏览：91

javascript还是php 发布：2025-03-12 00:41:12 浏览：697

微博抽奖算法发布：2025-03-12 00:41:10 浏览：112

抖音的麦克风在哪里打开安卓版发布：2025-03-12 00:35:15 浏览：122

压缩碳滤芯发布：2025-03-12 00:21:11 浏览：418

php两个数组并集发布：2025-03-12 00:15:00 浏览：339

程序员编译

与程序员编译相关的资讯