当前位置: 代码迷 >> 综合 >> llvm IR基础结构
  详细解决方案

llvm IR基础结构

热度:48   发布时间:2024-02-01 20:26:19.0

llvm IR基础结构 个人描述

  • 一 、llvm背景知识
  • 二、Module
  • 三、Function
  • BasicBlock
  • Instruction

一 、llvm背景知识

llvm的前端就是clang,clang将源码编译为IR文件,IR经过N个pass的优化处理,生成优化后的IR执行效率更低、体积更小(bitcode是代码的一种表示形式),后端则是把优化后的bitcode编译为指定目标架构的机器码。 IR属于llvm的前端。

二、Module

Module相当于一个.c文件,每个Module之间相互独立,Module主要包含了声明或者定义的函数、声明或定义的全局变量等。
为了获取 Module 的主要信息,使用它的 M.dump() 方法就会在屏幕上打印出全部信息。

三、Function

  • Function,是 Module中以List的方式存放。
  • Function 无法单独存在,必须是在某个 Module里。
  • 主要包含了大量 BasicBlock 、参数和返回值类型、可变参数列表、函数的attribute和其他函数的基本信息
  • Function由无数个 BasicBlock组成,使用列表存放,有且仅有一个 EntryBlock ,是列表中的第一个 BasicBlock,代码真正执行的时候,就从 EntryBlock开始执行。
  • Function有两个很实用的函数, F.dump() 可以打印出全部信息, F.viewCfg() 可以将ControlFlowGraph按照dot的方式存到文件里

BasicBlock

  • BasicBlock,是 Function 中以List方式存放.
  • 要包含了大量的 Instruction ,前驱、后继的 BasicBlock,以及一些基本信息.
  • BasicBlock由很多 Instruction组成,按照是否为 TerminatorInst 可以将指令分为两类,一类是普通的指令,一类是可以成为 TerminatorInst 的指令;
  • 因此 BasicBlock一定要以 TerminatorInst类的指令结尾,而且除了最后一个指令是 TerminatorInst,其他指令都是普通指令。常见的 TerminatorInst 有 BranchInst 、 IndirectBrInst 、 SwitchInst 和 Return
  • 每个 BasicBlock都可以视为一段顺序执行的代码.
  • BasicBlock 有两种创建方式,一种是凭空创建,然后插入到之前的CFG里;一种比较方便,使用 SplitBasicBlock ,切为相连的两块,可能会遇到PhiNode的问题。

Instruction

  • Instruction ,是 BasicBlock 中以List方式存放