汇编语言(assembly language)是一种用于电子
计算机、微处理器、微控制器或其他可编程器件的低级语言,亦称为符号语言。在汇编语言中,用助记符代替机器指令的操作码,用地址符号或标号代替指令或操作数的地址。在不同的设备中,汇编语言对应着不同的机器语言指令集,通过汇编过程转换成机器指令。特定的汇编语言和特定的机器语言指令集是一一对应的,不同平台之间不可直接移植。
现在汇编语言已不像其他大多数的
程序设计语言一样被广泛用于程序设计,在实际应用中,它通常被应用在底层硬件操作和高要求的程序优化的场合。驱动程序、嵌入式操作系统和实时运行程序中都需要汇编语言。
概念
汇编语言由汇编指令和汇编伪指令两部分组成,汇编指令是机器指令的地址部分符号化表示。其操作码采用易记的操作符表示,而地址码则采用标号、变量名字、常数等直观的表示形式。汇编指令基本上与机器指令保持一一对应的关系,在汇编过程中,它将被翻译成对应的机器指令。运行时,它将执行相应机器指令所规定的功能,汇编伪指令又称作汇编指示,其作用是指示汇编程序如何进行汇编,用于向汇编程序提供用户自定义的符号、数据类型、数据空间长度、目标程序格式、数据或指令的存放位置等提示信息。采用汇编语言编写程序虽不如高级语言简单、直观,而且必须对机器内部结构和特性有较多的了解,但它占用内存少ꎬ运行效率高,且能直接控制各种设备资源。因此,汇编语言经常用于编写大型软件系统的核心部分程序,或者用于编写运行时间长或实时性要求高的程序部分。
在不断吸收先进编程思想和相关软件优点的基础上,发展、演变出各具特色的汇编语言。模块汇编语言是在模块程序设计思想指导下,以模块作为编程基本单位而设计的汇编语言。它支持单个模块独立汇编和多个模块联合汇编的功能,宏汇编语言是在汇编语言的基础上,增加宏定义和宏调用功能而形成的汇编语言。它将为用户提供自定义指令的功能,高级汇编语言是在汇编语言的基础上,增加
高级语言中控制语句成分(如条件语句、循环语句、函数和过程等)而成的汇编语言。它既保持汇编语言的有效性和灵活性,又充分发挥了高级语言简单、直观、易于编写等优点,条件汇编语言是在汇编语言中引进“条件转移”和“无条件转移”等汇编指示,这将为用户提供一种简便、灵活的剪裁(选择或跳过源程序)的手段。
发展历程
编程语言阶段
自从1946年世界上第一台电子
计算机问世,人类和机器的交流方式和语言就成为了软件工程师和计算机从业者的主要研究方向,更有效更简便的编程语言成为了软件工程师的新宠儿,伴随着计算机的飞速发展,计算机的硬件升级速度也越来越快,对编程语言的要求也日益严格。在过去的几十年,编程语言有了长足的发展,已经有四代语言问世。大量的编程语言为了满足不同领域的编程要求和软件功能,经历 了被修改,被取代,被发展等过程,最终发展成了现在编程语言的多样化。尽管人们多次试图寻找一个能够适应所有编程环境的通用语言,但 是却没有一次成功。
程序设计语言正在与现代科技日益飞跃,人类的智慧在日益彰显。
机器语言阶段
计算机的硬件作为一种电路元件,它的输出和输入只能是有电或者没电,也就是所说的高电平和低电平,所以计算机传递的数据是由“0” 和“1”组成的
二进制数,所以说二进制的语言是计算机语言的本质。计算机发明之初,人们为了去控制计算机完成自己的任务或者项目,只能去编写“0”、“ 1”这样的二进制数字串去控制电脑,其实就是控制计算机硬件的高低电平或通路开路,这种语言就是机器语言。直观上看,机器语言十分晦涩难懂,其中的含义往往要通过查表或者手册才能理解, 使用的时候非常痛苦,尤其当你需要修改已经完成的程序时,这种看起来无序的机器语言会让你无从下手,也很难找到程序的错误。而且,不同
计算机的运行环境不同,指令方式操作方式也不尽相同,所以当你在这种机器语言就有了特定性,只能在特定的计算机上执行,而一旦换了机器就需要重新编程,这极大的降低了程序的使用和推广效率。但由于机器语言具有特定性,完美适配特定型号的计算机,故而运行效率远远高过其他语言。机器语言,也就是第一代
编程语言。
汇编语言阶段
不难看出机器语言作为一种编程语言, 灵活性较差可阅读性也很差,为了减轻机器语言带给软件工程师的不适应,人们对机器语言进行了升级和改进:用一些容易理解和记忆的字母,单词来代替一个特定的指令。通过这种方法,人们很容易去阅读 已经完成的程序或者理解程序正在执行的功能,对现有程序的bug修复以及运营维护都变得更加简单方便,这种语言就是我们所说的汇编语言, 即第二代
计算机语言。
比起机器语言,汇编语言具有更高的机器相关性,更加便于记忆和书写,但又同时保留了机器语言高速度和高效率的特点。汇编语言仍是面向机器的语言,很难从其代码上理解
程序设计意图,设计出来的程序不易被移植,故不像其他大多数的高级计算机语言一样被广泛应用。所以在
高级语言高度发展的今天,它通常被用在底层,通常是程序优化或硬件操作的场合。
语言组成
由于汇编指令系统庞大,因而需构建指令系统体系,其指令数量庞大,格式复杂,可记忆性差等。指令中最难的是指令所支持的寻址方式,其实质就是指令中操作数如何获取。对于处理器而言,就是如何找到他所需的数据。但对于
计算机底层的汇编语言而言,这种寻址方式将涉及大量的计算存储格式,与 复杂的存储管理方式紧密相关,因而难以理解。最后,汇编指令还关系到如何影响标志位,但处理器标志位非常复杂,因而对其机制掌握就比较困难。
传送指令
包括通用数据传送指令MOV、条件传送指令CMOVcc、
堆栈操作指令PUSH/PUSHA/PUSHAD/POP/POPA/POPAD、交换指令XCHG/XLAT/BSWAP、地址或段描述符选择子传送指令LEA/LDS/LES/LFS/LGS/LSS等。
逻辑运算
这部分指令用于执行算术和逻辑运算,包括加法指令ADD/ADC、减法指令SUB/SBB、加一指令INC、减一指令DEC、比较操作指令CMP、乘法指令MUL/IMUL、除法指令DIV/IDIV、符号扩展指令CBW/CWDE/CDQE、十进制调整指令DAA/DAS/AAA/AAS、逻辑运算指令NOT/AND/OR/XOR/TEST等。
移位指令
这部分指令用于将
寄存器或
内存操作数移动指定的次数。包括逻辑左移指令SHL、逻辑右移指令SHR、算术左移指令SAL、算术右移指令SAR、循环左移指令ROL、循环右移指令ROR等。
位操作
这部分指令包括位测试指令BT、位测试并置位指令BTS、位测试并复位指令BTR、位测试并取反指令BTC、位向前扫描指令BSF、位向后扫描指令BSR等。
控制转移
这部分包括无条件转移指令JMP、条件转移指令Jcc/JCXZ、循环指令LOOP/LOOPE/LOOPNE、过程调用指令CALL、子过程返回指令RET、中断指令INTn、INT3、INTO、IRET等。
串操作
这部分指令用于对数据串进行操作,包括串传送指令MOVS、串比较指令CMPS、串扫描指令SCANS、串加载指令LODS、串保存指令STOS,这些指令可以有选择地使用REP/REPE/REPZ/REPNE和REPNZ的前缀以连续操作。
输入输出
这部分指令用于同外围设备交换数据,包括端口输入指令IN/INS、端口输出指令OUT/OUTS。
语言特点
汇编语言是
计算机提供给用户的最快最有效的语言,也是能够利用计算机的所有硬件特性并能够直接控制硬件的唯-语言。但是由于编写和调试汇编语言程序要比
高级语言复杂,因此目前其应用不如高级语言广泛。
汇编语言比机器语言的可读性要好,但跟高级语言比较而言,可读性还是较差。不过采用它编写的程序具有存储空间占用少、执行速度快的特点,这些是高级语言所无法取代的。在实际应用中,是否使用汇编语言,取决于具体应用要求、软件开发时间和质量等方面作权衡。
优点
汇编语言作为机器语言之上的第二代
编程语言,它也有很多优点:
1)可以轻松的读取存储器状态以及硬件I/O接口情况
2)编写的代码因为少了很多编译的环节,可以能够准备的被执行
3)作为一种低级语言,可扩展性很高
缺点
1)因为代码非常单调,特殊指令字符很少,所以造成了代码的冗长以及编写的困难
2)因为汇编仍然需要自己去调用存储器存储数据,很容易出现BUG,而且调试起来也不容易
3)就算完成了一个程序,后期维护时候也需要耗费大量的时间。
对比高级语言
区别
汇编语言的特点是能被
计算机直接识别和执行,使用它进行编程可以减少占用空间、提高运行速度,并能直接对硬件实施控制。在需要实时控制的时候,有着不可替代的重要地位,但汇编语言在编程和理解时要复杂、困难一些,尤其是在进行数据处理或是逻辑运算时更加凸显出其劣势。
高级语言是面向使用者的语言,能更准确地被程序员所理解,它的表达能力强,功能多,编程效率高,上手速度快,自动化程度高,因而更受欢迎。在大部分软件开发中,使用者都采用
高级语言编程,以提高编程效率。但在要求存储空间小,执行速度快,需直接对硬件进行控制的场合,则应用汇编语言编程,以达到优化程序速度的目的。
联系
这样两种看似差别很大的语言,它们之间又有着紧密的联系。在一些
程序设计当中,如果把两者结合起来使用,将两种语言的优势同时发挥出来,则可以解决很多特性难题。在许多程序的设计当中,高级语言和汇编语言可以相互交叉调用,进行参数传递,共享数据信息,这便是所谓的混合编程。程序员往往在
高级语言程序中直接嵌入汇编语句,以实现对硬件直接进行控制的功能,这是混合编程中常见的做法。也可以在高级语言程序中使用汇编语言中定义的变量和常量,或使用内部函数对汇编语句进行调用。简而言之,这类混合编程的方法可以让高级语言与汇编语言互相取长补短,各自发挥各自优势,同时减少各自缺点所带来的不便,善用这个方法可以使开发和编程工作达到事半功倍的效果。
相关技术
汇编器
典型的现代汇编器(assembler)建造目标代码,由解译组语指令集的易记码(mnemonics)到操作码(OpCode),并解析符号名称(symbolic names)成为存储器地址以及其它的实体。使用符号参考是汇编器的一个重要特征,它可以节省修改程序后人工转址的乏味耗时计算。基本就是把机器码变成一些字母而已,编译的时候再把输入的指令字母替换成为晦涩难懂机器码。
编译环境
用汇编语言等非机器语言书写好的符号程序称为源程序,
汇编语言编译器的作用是将源程序翻译成目标程序。目标程序是机器语言程序,当它被安置在
内存的预定位置上后,就能被
计算机的CPU处理和执行。
汇编的调试环境总的来说比较少,也很少有非常好的编译器。
编译器的选择依赖于目标处理器的类型和具体的系统平台。一般来说,功能良好的编译器用起来应当非常方便,比如,应当可以自动整理格式、语法高亮显示,集编译、链接和调试为一体,方便实用。
对于广泛使用的
personal computer来说,可以自由选择的
汇编语言编译器有
MASM、NASM、TASM、GAS、FASM、RADASM等,但大都不具备调试功能。如果是为了学习汇编语言,轻松汇编因为拥有一个完善的集成环境,是一款非常适合初学者的汇编编译器。
发展前景
随着现代软件系统越来越庞大复杂,大量经过了封装的
高级语言如C/
C++,Pascal/Object Pascal也应运而生。这些新的语言使得程序员在开发过程中能够更简单,更有效率,使软件开发人员得以应付快速的软件开发的要求。而汇编语言由于其复杂性使得其适用领域逐步减小。但这并不意味着汇编已无用武之地。由于汇编更接近机器语言,能够直接对硬件进行操作,生成的程序与其他的语言相比具有更高的运行速度,占用更小的内存,因此在一些对于时效性要求很高的程序、许多大型程序的核心模块以及工业控制方面大量应用。
虽然随着半导体技术、编程技术的不断发展,在实际工程应用中确实很少看到汇编语言的身影,但这并不能说明汇编语言没用,已被其他
高级语言所取代。
嵌入式系统的底层驱动、
计算机的BIOS还是要用汇编语言实现。汇编语言是培养学生理解硬件资源的语言,是学习和理解其他高级程序设计语言的基础,是计算机组成原理、接口与通信技术、计算机控制技术和数据采集等许多专业课的前导课程,是必要的基础知识,起着承上启下的作用。