x86-64 SysV ABI中的参数和返回值寄存器的高位是否允许乱码?

BeeOnRope:

x86-64 SysV ABI除其他事项外,指定如何在寄存器中传递函数参数(在中的第一个参数rdi,然后依次rsi类推),以及如何将整数返回值传递回(对于真正的大值rax,则传递rdx)。

但是,我找不到的是传递小于64位的类型时参数或返回值寄存器的高位应该是什么。

例如,对于以下功能:

void foo(unsigned x, unsigned y);

... x将被传入rdiyrsi,但他们只是32位。不要的高32位rdirsi需求为零?直观上,我会假设是的,但是所有gcc,clang和icc 生成代码mov在开始时都有特定的指令将高位清零,因此,似乎编译器会假设其他情况。

同样,编译器似乎假设rax如果返回值小于64 位,则返回值的高位可能具有垃圾位。例如,以下代码中的循环:

unsigned gives32();
unsigned short gives16();

long sum32_64() {
  long total = 0;
  for (int i=1000; i--; ) {
    total += gives32();
  }
  return total;
}

long sum16_64() {
  long total = 0;
  for (int i=1000; i--; ) {
    total += gives16();
  }
  return total;
}

... 编译到下面clang(和其他编译器是相似的):

sum32_64():
...
.LBB0_1:                               
    call    gives32()
    mov     eax, eax
    add     rbx, rax
    inc     ebp
    jne     .LBB0_1


sum16_64():
...
.LBB1_1:
    call    gives16()
    movzx   eax, ax
    add     rbx, rax
    inc     ebp
    jne     .LBB1_1

请注意,mov eax, eax调用之后的返回32位,以及movzx eax, ax调用之后的16位-都分别将前32位或48位清零。因此,此行为会产生一些成本-处理64位返回值的同一循环会忽略此指令。

我已经非常仔细地阅读了x86-64 System V ABI文档,但是找不到标准中是否记录了此行为。

这样的决定有什么好处?在我看来似乎有明确的成本:

参数成本

处理参数值时,会给被调用方的实现带来成本。以及在处理参数时的功能。当然,由于该函数可以有效地忽略高位,所以该开销通常为零,或者由于可以使用32位操作数大小指令隐式将高位清零,所以零值是免费的。

但是,对于接受32位参数并执行一些可以从64位数学中受益的数学函数的情况,开销通常是非常现实的。这个功能为例:

uint32_t average(uint32_t a, uint32_t b) {
  return ((uint64_t)a + b) >> 2;
}

直接使用64位数学来计算否则必须仔细处理溢出的函数(以这种方式转换许多32位函数的能力通常是64位体系结构未注意到的好处)。编译为:

average(unsigned int, unsigned int):
        mov     edi, edi
        mov     eax, esi
        add     rax, rdi
        shr     rax, 2
        ret  

ret仅需要将高位清零,就需要4条指令中的2条(忽略)。在实践中使用消除运动可能很便宜,但是似乎仍然要付出很大的代价。

另一方面,如果ABI将高位指定为零,则对于调用者来说,我真的看不到类似的费用。因为rdirsi和其他传递参数的寄存器是临时的(即可以被调用者覆盖),所以您只有两种情况(我们看一下rdi,但是将其替换为您选择的参数reg):

  1. rdi在调用后代码中,传递给in中的函数的值已失效(不需要)。在这种情况下,最后分配给的任何指令rdi都必须改为分配edi这不仅是免费的,而且如果避免使用REX前缀,通常会小一个字节。

  2. 传递给函数的值rdi 功能后需要。在这种情况下,由于rdi已保存了调用者,因此调用者mov无论如何都要对保存的寄存器执行值的a。通常,您可以对其进行组织,以使该值被调用方保存的寄存器(例如rbx)中开始,然后将其移至edilike mov edi, ebx,因此无需花费任何费用。

我看不到在很多情况下调零会给调用者带来很多费用。例如,如果在最后一个分配的指令中需要64位数学运算,则可能会出现一些示例rdi不过,这似乎很少见。

退货成本

这里的决定似乎更加中立。mov eax, eax被调用者清除垃圾具有确定的代码(有时您会看到执行此操作的说明),但是如果允许垃圾,则成本将转移给被调用者。总体而言,调用者似乎更有可能免费清除垃圾,因此允许垃圾似乎并不会对性能造成整体影响。

我想针对这种行为的一个有趣用例是,大小不同的函数可以共享相同的实现。例如,以下所有功能:

short sums(short x, short y) {
  return x + y;
}

int sumi(int x, int y) {
  return x + y;
}

long suml(long x, long y) {
  return x + y;
}

可以实际共享相同的实现1

sum:
        lea     rax, [rdi+rsi]
        ret

1是否确实允许针对具有其地址的功能进行这种折叠,这有很多争议

用户1354557:

您似乎在这里有两个问题:

  1. 返回值的高位是否需要在返回之前清零?(在调用之前,是否需要将参数的高位清零?)
  2. 与该决定相关的成本/收益是什么?

第一个问题的答案是否定的,高位可能有垃圾,并且Peter Cordes已经就该主题写了一个很好的答案

关于第二个问题,我怀疑未定义高位总体上对于性能而言更好。一方面,使用32位运算时,零扩展值无需付出任何额外费用。但是另一方面,并​​非总是需要事先将高位清零。如果允许高位垃圾,则可以将其留给接收值的代码,以便仅在实际需要时才执行零扩展(或符号扩展)。

但我想强调另一个考虑因素:安全性

信息泄漏

当未清除结果的高位时,它们可能会在堆栈/堆中保留其他信息的片段,例如函数指针或地址。如果存在执行更高特权的功能并在之后检索rax(或eax的全部值的机制,则可能会导致信息泄漏例如,系统调用可能会将指针从内核泄漏到用户空间,从而导致内核ASLR失败否则IPC机制可能会泄漏有关另一个进程的地址空间的信息,这可能有助于开发沙箱突破。

当然,可能有人争辩说,防止信息泄露不是ABI的责任;程序员应正确执行其代码。虽然我确实同意,但要求编译器将高位归零,仍然可以消除这种特殊形式的信息泄漏。

你不应该相信你的输入

另一方面,更重要的是,编译器不应盲目地相信任何接收到的值的高位都清零,否则函数可能无法按预期运行,这也可能导致可利用的条件。例如,考虑以下内容:

unsigned char buf[256];
...
__fastcall void write_index(unsigned char index, unsigned char value) {
    buf[index] = value;
}

如果允许我们假设index其高位清零,那么我们可以将上面的代码编译为:

write_index:  ;; sil = index, dil = value
    mov rax, offset buf
    mov [rax+rsi], dil
    ret

但是,如果我们能够从我们自己的代码中调用这个函数,我们可以值提供rsi出的[0,255]范围,并写入到内存超出缓冲区的范围。

当然,编译器实际上不会生成这样的代码,因为如上所述,被调用方有责任对自己的参数进行零扩展或符号扩展,而不是调用方的参数扩展我认为,这是一个非常实际的原因,要使接收值的代码始终假定高位有垃圾并明确将其删除。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Vararg x86-64 ABI。寄存器中的浮点参数数

保留堆栈中的字节:x86汇编(64位)

x64 Appdomain中的x86程序集-x86 exe正常工作,x86 dll失败

x86 32位汇编代码是否有效x86 64位汇编代码?

x86-64上的C ++:何时在寄存器中传递和返回结构/类?

Mingw 生成的 x86 程序只能以管理员身份成功运行 - x64 和 VS(x86 和 x64)版本正常

gcc x86 / x86_64 ABI:ss是否必须等于ds / es / fs / gs?

我是否需要x64和x86版本的C ++ redist

x86和x64处理器上的CPU指令延迟

x86和x64中不受管理的互操作性能

在Visual Studio 2012中同时将平台目标x86和x64

x86和x64中的ret指令有什么区别?

x86在x86-x64中不同或已完全删除的32位操作码

IIS是否针对Azure云服务运行x64或x86?

是否可以在C#项目中混合使用x64 / x86?

平台目标(x86 / x64 / AnyCPU)是否对.net卫星程序集很重要

编写AMD64 SysV程序集时,哪个寄存器可用作临时寄存器?

x64处理器上的x86实时图像

x86和x64有什么区别

x64和x86之间字节数组访问的巨大性能差异

使用 CMake 通过 CLion 同时为多个目标构建 x86 和 x64

如何为x86和x64平台指定不同的BootstrapperPackage-s?

将x86和x64库添加到NuGet包

XmlSerializer为x86和x64产生不同的输出

浮点运算以及x86和x64上下文

如何使用WIX静默安装VC ++ 2005 Redistributable x64和x86

为 x86 和 x64 架构注册 .msi(安装项目)

针对x86和x64平台构建项目目标

将 x86 和 x64 工件部署到 Github Releases 上的 AppVeyor