汇编语言 字符串
在前面的示例中,我们已经使用了可变长度的字符串。可变长度字符串可以根据需要包含任意多个字符。通常,我们通过以下两种方式之一指定字符串的长度:- 显式存储字符串长度
- 使用哨兵字符
我们可以使用表示位置计数器当前值的$位置计数器符号来显式存储字符串长度。在以下示例中-msg db 'Hello, world!',0xa ;我们常见的字符 len equ $ - msg ;长度
$指向字符串变量msg的最后一个字符之后的字节。因此,$ - msg给出字符串的长度。我们也可以写msg db 'Hello, world!',0xa ;our dear string len equ 13 ;length of our dear string
另外,您可以存储带有尾部定点字符的字符串来定界字符串,而不是显式存储字符串长度。前哨字符应为不出现在字符串中的特殊字符。例如-message DB 'I am loving it!', 0
每个字符串指令可能需要一个源操作数,一个目标操作数或两者。对于32位段,字符串指令使用ESI和EDI寄存器分别指向源和目标操作数。但是,对于16位段,SI和DI寄存器分别用于指向源和目标。有五个用于处理字符串的基本说明。他们是-- MOVS-该指令将1字节,字或双字数据从存储位置移到另一个位置。
- LODS-该指令从存储器加载。如果操作数是一个字节,则将其加载到AL寄存器中;如果操作数是一个字,则将其加载到AX寄存器中,并将双字加载到EAX寄存器中。
- STOS-该指令将数据从寄存器(AL,AX或EAX)存储到存储器。
- CMPS-该指令比较内存中的两个数据项。数据可以是字节大小,字或双字。
- SCAS-该指令将寄存器(AL,AX或EAX)的内容与内存中项目的内容进行比较。
上面的每个指令都有字节,字和双字版本,并且可以通过使用重复前缀来重复字符串指令。这些指令使用ES:DI和DS:SI对寄存器,其中DI和SI寄存器包含有效的偏移地址,这些地址指向存储在存储器中的字节。SI通常与DS(数据段)相关联,DI通常与ES(额外段)相关联。DS:SI(或ESI)和ES:DI(或EDI)寄存器分别指向源和目标操作数。假定源操作数位于内存中的DS:SI(或ESI),目标操作数位于ES:DI(或EDI)。对于16位地址,使用SI和DI寄存器,对于32位地址,使用ESI和EDI寄存器。下表提供了各种版本的字符串指令和假定的操作数空间。基本指令 操作的寄存器 字节运算 字运算 双字运算 MOVS ES:DI,DS:SI MOVSB MOVSW MOVSD LODS DS:SI LODSB LODSW LODSD STOS ES:DI,AX STOSB STOS STOSD CMPS DS:SI,ES:DI CMPSB CMPSW CMPSD SCAS ES:DI,AX SCASB SCASW SCASD -
尝试一下section .text global _start ;must be declared for using gcc _start: ;tell linker entry point mov ecx, len mov esi, s1 mov edi, s2 cld rep movsb mov edx,20 ;message length mov ecx,s2 ;message to write mov ebx,1 ;file descriptor (stdout) mov eax,4 ;system call number (sys_write) int 0x80 ;call kernel mov eax,1 ;system call number (sys_exit) int 0x80 ;call kernel section .data s1 db 'Hello, world!',0 ;string 1 len equ $-s1 section .bss s2 resb 20 ;destination
编译并执行上述代码后,将产生以下结果-Hello, world!
尝试一下section .text global _start ;must be declared for using gcc _start: ;tell linker entry point mov ecx, len mov esi, s1 mov edi, s2 loop_here: lodsb add al, 02 stosb loop loop_here cld rep movsb mov edx,20 ;message length mov ecx,s2 ;message to write mov ebx,1 ;file descriptor (stdout) mov eax,4 ;system call number (sys_write) int 0x80 ;call kernel mov eax,1 ;system call number (sys_exit) int 0x80 ;call kernel section .data s1 db 'password', 0 ;source len equ $-s1 section .bss s2 resb 10 ;destination
尝试一下section .text global _start ;must be declared for using gcc _start: ;tell linker entry point mov ecx, len mov esi, s1 mov edi, s2 loop_here: lodsb or al, 20h stosb loop loop_here cld rep movsb mov edx,20 ;message length mov ecx,s2 ;message to write mov ebx,1 ;file descriptor (stdout) mov eax,4 ;system call number (sys_write) int 0x80 ;call kernel mov eax,1 ;system call number (sys_exit) int 0x80 ;call kernel section .data s1 db 'HELLO, WORLD', 0 ;source len equ $-s1 section .bss s2 resb 20 ;destination
编译并执行上述代码后,将产生以下结果-hello, world
尝试一下section .text global _start ;must be declared for using gcc _start: ;tell linker entry point mov esi, s1 mov edi, s2 mov ecx, lens2 cld repe cmpsb jecxz equal ;jump when ecx is zero ;If not equal then the following code mov eax, 4 mov ebx, 1 mov ecx, msg_neq mov edx, len_neq int 80h jmp exit equal: mov eax, 4 mov ebx, 1 mov ecx, msg_eq mov edx, len_eq int 80h exit: mov eax, 1 mov ebx, 0 int 80h section .data s1 db 'Hello, world!',0 ;our first string lens1 equ $-s1 s2 db 'Hello, there!', 0 ;our second string lens2 equ $-s2 msg_eq db 'Strings are equal!', 0xa len_eq equ $-msg_eq msg_neq db 'Strings are not equal!' len_neq equ $-msg_neq
编译并执行上述代码后,将产生以下结果-Strings are not equal!
尝试一下section .text global _start ;must be declared for using gcc _start: ;tell linker entry point mov ecx,len mov edi,my_string mov al , 'e' cld repne scasb je found ; when found ; If not not then the following code mov eax,4 mov ebx,1 mov ecx,msg_notfound mov edx,len_notfound int 80h jmp exit found: mov eax,4 mov ebx,1 mov ecx,msg_found mov edx,len_found int 80h exit: mov eax,1 mov ebx,0 int 80h section .data my_string db 'hello world', 0 len equ $-my_string msg_found db 'found!', 0xa len_found equ $-msg_found msg_notfound db 'not found!' len_notfound equ $-msg_notfound
REP前缀在字符串指令(例如-REP MOVSB)之前设置时,会根据放置在CX寄存器中的计数器使该指令重复。REP执行该指令,将CX减1,然后检查CX是否为零。重复指令处理,直到CX为零为止。方向标志(DF)确定操作的方向。- 使用CLD(清除方向标志,DF = 0)使操作从左到右。
- 使用STD(设置方向标志,DF = 1)使操作从右到左。
REP前缀也有以下变化:- REP:这是无条件的重复。重复该操作,直到CX为零为止。
- REPE或REPZ:这是有条件的重复。当零标志指示等于/零时,它将重复操作。当ZF表示不等于零或CX为零时,它将停止。
- REPNE或REPNZ:这也是有条件的重复。当零标志指示不等于/零时,它将重复操作。当ZF指示等于/零或CX减为零时,它将停止。