常见目标机器语言
X86/64
ARM
RISC-V
MIPS
PowerPC
汇编指令代码 -> 汇编器 -> 二进制目标代码
汇编指令 mnemonics
转换成 二进制编码 opcodes
常用二进制目标文件格式
COFF( System V Unix)
PE( Windows)
ELF( Linux)
链接器Linker
复制二进制目标文件(链接)程序executable
从库文件中提取需要使用的目标代码
排布目标代码的地址位置
计算外部引用的地址
Java 解释器 JIT AOT
.java -> .class -> 解释器 [ -> jit编译器 ] -> 机器码
JIT编译 just-in-time
运行中解释程序
优化代码,暂存编译结果提高效率
AOT编译 ahead-of-time
执行前编译程序
运行中执行机器码
安卓中的oat文件,就是安卓应用AOT编译后的二进制文件
编译器 High-Level 架构
语言前端
输入:字符序列
词法分析
将字符分组,每一个字符都会被分类放好
词法分析工具lex等
输入:元语(token)序列
语法分析器会将Token流翻译抽象语法树
主要关心操作数的CST 会完整的表达
语法分析
输入:抽象语法树 AST
语义分析
语言后端
输入:中间表达 IR
优化&变换
代码生成
从IR生成目标语言的代码
为操作数指定寄存器或者栈存储空间
并调整指令的顺序以使用不同的处理器
输出:目标语言代码
add
制程瓶颈,通用算力——摩尔定律
异构芯片和异构计算是发展趋势,特定领域的高效执行,但也有软件碎片化的问题(异构并行编程语言和编译器)
多样新算力需要编译器使能统一编程语言和异构统一编译器,实现多指令集间统一编译
提升编译性能,优化静态优化方法,感知内存属性(?),cost model指导优化