5 符号表管理技术

1 概述

1.1 什么是符号表

在编译过程中，编译程序用来记录源程序中各种名字的特性信息，所以也称为名字特性表。
名字: 用户自定义的名字：程序名、过程名、函数名、用户定义类型名、变量名、常量名、枚举值名、标号名等。
特性信息: 上述名字的种类、类型、维数、参数个数及目标地址（存储单元地址）等。

1.2 建表和查表的必要性(符号表在编译过程中的作用)

源程序中变量要先声明，然后才能引用。
用户通过声明语句，声明各种名字，并给出它们的类型维数等信息。编译程序在遇到这些声明语句时，应该将声明中的名字以及信息登录到符号表中，同时编译程序还要给变量分配存储单元。
存储单元地址也必须登录在符号表中。
当编译程序编译到引用所声明的变量时（赋值或引用其值），要进行语法语义正确性检查（类型是否符合要求等）和生成相应的目标程序，这就需要查符号表以取得相关信息。

1.3 有关符号表的操作：填表和查表

填表：当分析到程序中的说明或定义语句时，应将说明或定义的名字，以及与之有关的信息填入符号表中。
例：Procedure P( )
查表：
1. 填表前查表，检查在程序的同一作用域内名字是否重复定义；
2. 检查名字的种类是否与说明一致；
3. 对于强类型语言，要检查表达式中各变量的类型是否一致；
4. 生成目标指令时，要取得所需要的地址。

0824 图 5.1 图 5.2
Pasted image 20250930082207.png
Pasted image 20250930082352.png

2 符号表的组织与内容

2.1 符号表的结构与内容

符号表基本结构如下
“名字”域：存放名字。一般为标识符的符号串，也可为指向标识符字符串的指针。
“特性”域：可包括多个子域，分别表示标识符的有关信息。如：
名字（标识符）的种类：简单变量、函数、过程、数组、标号、参数等
类型：如整型、浮点型、字符型、指针等
性质：变量形参、值形参等
值：常量名所代表的数值
地址：变量所分配单元的首址或地址位移
大小：所占的字节数
作用域的嵌套层次:
对于数组：维数、上下界值、计算下标量地址所用的信息（数组信息向量）以及数组元素类型等。
对于记录（结构、联合）：域的个数，每个域名、地址位移、类型等。
对于过程或函数：形参个数、所在层次、函数返回值类型、局部变量所占空间大小等。
对于指针：所指对象类型等。

2.2 符号表的组织方式

统一符号表——不论什么名字都填入统一格式的符号表中
符号表表项应按信息量最大的名字设计。填表、查表比较方便，结构简单，但是浪费大量空间。
对于不同种类的名字分别建立各种符号表
节省空间，但是填表和查表不方便。
① 符号名表（用来登记源程序中的常量名、变量名、数组名和过程名等，并记录其属性、引用等）
② 常数表（分类型登记各种常量值）
③ 标号表（登记标号的定义与应用）
④ 分程序入口表（登记过程的层号、分程序符号表的入口等）
⑤ 中间代码表
折中办法——大部分共同信息组成统一格式的符号表。特殊信息另设附表，两者用指针连接。

3 非分程序结构语言的符号表组织

3.1 非分程序的结构语言

非分程序的结构语言：每个可独立进行编译的程序单元是一个不包含有子模块的
————不允许嵌套
FORTAN 程序构造
主程序和子程序中可定义 common 语句：
FORTRAN 程序中各程序单位之间的数据交换可以通过虚实结合来实现，也可以通过建立公用区的方式来完成。
公用区有两种，一种是无名公用区，任何一个程序中只可能有一个无名公用区；
一种是有名公用区，一个程序中可以根据需要由程序员开辟任意多个有名公用区。
无名和有名公用区都通过COMMON语句来进行建立。

3.2 标识符的作用域及基本处理办法

作用域
全局：子程序名、函数名和公共区名。
局部：程序单元中定义的变量。
符号表的组织
基本处理办法
1. 子程序、函数名和公共区变量填入全局符号表。
2. 在子程序(函数)声明部分读到标识符时，构造局部符号表。
3. 在语句部分读到标识符，查表。
程序单元结束：释放该程序单元的局部符号表。
程序执行完成：释放全部符号表。

3.3 符号表的组织方式

无序符号表——按扫描顺序建表，查表要逐项查找。
查表操作的平均长度为。
有序符号表：符号表按变量名进行字典式排序。
线性查表:
折半查表:
散列符号表（Hash表）：
符号表地址 = Hash（标识符）
解决冲突

4 分程序结构语言的符号表组织

4.1 分程序的结构语言

模块内可嵌入子模块。

4.2 标识符的作用域和基本处理方法

4.2.1 作用域

作用域：标识符局部于所定义的模块（最小模块）

模块中所定义标识符的作用域是定义该标识符的子程序。
过程或函数说明中定义的标识符（包括形参）其作用域为本过程体。
循环语句中定义的标识符，其作用域为该循环语句。
不能从循环体外转到循环体内。循环语句应看作一层！

4.2.2 基本处理办法

基本处理办法：
建查符号表均要遵循标识符作用域规定进行。
建表：不能重复，不能遗漏。
查表：按标识符作用域查找。
处理方法
假设标识符是先声明后引用（标号例外，要特殊处理）。
1. 在程序声明部分读到标识符时（声明性出现）建表
2. 在语句中读到标识符（引用性出现），查表
3. 标准标识符的处理
  主要是语言定义的一些标准过程和函数的名字。它们是标识符的子集。如 sin con abs….（注意它们不是语言的保留字）
  - 特点
    1. 用户不必声明就可全程使用。
    2. 设计编译程序时，标准名字及其数目已知。
  - 处理方法
    1. 单独建表：使用不便，费时。
    2. 预先将标准标识符填入名字表中。因为它们是全程量，所以应填入最外层。

4.3 符号表的组织方式

每个分程序一个分程序符号表，然后有一个分程序索引表

分层组织符号表的登记项
各分程序符号表登记项按照语法识别顺序连续排列在一起，不为其内层分程序的符号表登记项所割裂。
用“分程序表”索引各分程序符号表的信息
分程序表中的各登记项是自左至右扫描源程序的过程中，按分程序出现的顺序依次填入的，且对每一个分程序填写一个登记项。
分程序表登记项序号隐含地表征各分程序的编号
分程序表结构

OUTERN——指明该分程序的直接外层分程序的编号
ECOUNT——记录该分程序符号表登记项的个数
POINTER——指向该分程序符号表的起始位置
分程序符号表构造方法：
1. 本例中，分程序符号表的形成顺序为2、4、3、1，这个次序是闭分程序的次序(分程序中END出现的次序)。
2. 为使各分程序的符号表连续地邻接在一起，并在扫描具有嵌套分程序结构的源程序时，总是按先进后出的顺序来扫描其中各个分程序，可设一个临时工作栈。
3. 每当进入一层分程序时，就在栈顶预造该分程序的符号表，而当遇到该层分程序的结束符(END)时，此时该分程序的全部登记项已位于栈顶，再将该分程序的全部登记项移至正式符号表中。

例子

Pasted image 20250930092347.png
Pasted image 20250930092354.png
Pasted image 20250930092401.png
Pasted image 20250930092410.png
Pasted image 20250930092420.png
函数名在上一层，参数名在下一层
Pasted image 20250930093148.png
参数名也可以放在本层，然后名字为空