在某些语言中,我被告知编译器将执行优化,以除去不必要的“中间”局部变量以提高执行效率。
有人知道Rust是否也这样做吗?例如,考虑以下代码片段:
fn main() {
// has four local variables
let x = 3;
let y = 5;
let temp_result = x + y;
let final_result = temp_result * 40;
println!("The final result is: {}", final_result);
}
与下面的实现比较,该实现似乎有零个显式创建的局部变量
fn main() {
// has no explicitly created local variables
println!("The final result is: {}", (3+5) * 40);
}
这些会生成相同的机器代码吗?
换句话说,在给定硬编码整数输入的情况下,编译器是否“意识到”第一种实现中的四个局部变量与第二种实现等效?
这是测试版本的游乐场链接。查看以发布模式生成的程序集:
playground::main:
pushq %r15
pushq %r14
pushq %r12
pushq %rbx
subq $72, %rsp
####################### f1() here
movl $320, 4(%rsp) # whole function optimized to static value of 320
#######################
leaq 4(%rsp), %r14
movq %r14, 8(%rsp)
movq core::fmt::num::imp::<impl core::fmt::Display for i32>::fmt@GOTPCREL(%rip), %r15
movq %r15, 16(%rsp)
leaq .L__unnamed_2(%rip), %rax
movq %rax, 24(%rsp)
movq $2, 32(%rsp)
movq $0, 40(%rsp)
leaq 8(%rsp), %rbx
movq %rbx, 56(%rsp)
movq $1, 64(%rsp)
movq std::io::stdio::_print@GOTPCREL(%rip), %r12
leaq 24(%rsp), %rdi
callq *%r12
####################### f2() here
movl $320, 4(%rsp) # same as with f1()
#######################
movq %r14, 8(%rsp)
movq %r15, 16(%rsp)
leaq .L__unnamed_3(%rip), %rax
movq %rax, 24(%rsp)
movq $2, 32(%rsp)
movq $0, 40(%rsp)
movq %rbx, 56(%rsp)
movq $1, 64(%rsp)
leaq 24(%rsp), %rdi
callq *%r12
addq $72, %rsp
popq %rbx
popq %r12
popq %r14
popq %r15
retq
因为返回值在您的示例中是静态已知的,所以函数甚至不会出现在编译后的代码中。即使定义如下函数,您实际上也会得到相同的结果:
fn f1(a: i32, b: i32, c:i32) -> i32 {
let x = a;
let y = b;
let temp_result = x + y;
let final_result = temp_result * c;
final_result
}
fn f2(a: i32, b: i32, c: i32) -> i32 {
(a + b) * c
}
pub fn main() {
println!("f1() = {}", f1(3, 5, 40));
println!("f2() = {}", f2(3, 5, 40));
}
如果在编译时不知道参数会怎样?这是另一个操场,这次是随机计算的值,并标记了两个函数#[inline(never)]
:
playground::f1:
leal (%rdi,%rsi), %eax
imull %edx, %eax
retq
playground::main:
# rng initialization...
.LBB7_20:
movl 8(%rbp,%rax,4), %ebx
addq $1, %rax
movq %rax, (%rbp)
movl %r15d, %edi
movl %r12d, %esi
movl %ebx, %edx
######################## f1() called here
callq playground::f1 #
########################
movl %eax, 4(%rsp)
leaq 4(%rsp), %rax
movq %rax, 8(%rsp)
movq core::fmt::num::imp::<impl core::fmt::Display for i32>::fmt@GOTPCREL(%rip), %r13
movq %r13, 16(%rsp)
leaq .L__unnamed_3(%rip), %rax
movq %rax, 24(%rsp)
movq $2, 32(%rsp)
movq $0, 40(%rsp)
leaq 8(%rsp), %rbp
movq %rbp, 56(%rsp)
movq $1, 64(%rsp)
movq std::io::stdio::_print@GOTPCREL(%rip), %r14
leaq 24(%rsp), %rdi
callq *%r14
movl %r15d, %edi
movl %r12d, %esi
movl %ebx, %edx
######################## and again here!
callq playground::f1 #
########################
# ...
retq
编译器实际上已经意识到这些功能是相同的,并将它们折叠为一个定义。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句