memset的速度vs直接分配为零

LML 发表于 Dev

LML

请在下面考虑结构定义。

struct xyz {
  char a;
  void *ptr;
  uint16_t num1;
  uint32_t num2;
  uint64_t num3;
};

我可以通过以下三种方式之一将此结构的实例初始化为零。

申报时
```
struct xyz instance = { 0 };
```
使用C-99功能进行声明后的某个时间。
```
instance = (const struct xyz) { 0 };
```

3。memset (&instance, 0, sizeof (struct xyz));

典型的C结构可以由编译器添加一些用于对齐目的的填充。因此memset会将填充字节也初始化为零。

我的问题是：

通常，通过以上方法1或2进行初始化是否会比方法3更快？不管保存多少CPU周期都没关系，我只是好奇1和2是否比3快。

巴西勒·斯塔林凯维奇

这是实施质量的问题。

^{（顺便说一句，从纯理论上讲，一个实现可能有一个NULL不是全零位字的指针;在这种情况下，§3的语义不同于§1或§2的语义;但是实际上，当今大多数通用处理器具有线性虚拟地址空间，并且其NULL指针为全零的字）}

最近GCC编译器（至少在通常的x86-64处理器），以使能优化（例如gcc -O2）有可能产生相同（或非常相似的）机器代码（因为memset作为被扩大__builtin_memset，其被具体地编译和经常内联），所以使用memset是实际上并不慢（并且由于矢量化，甚至可能变得更快，例如AVX机器指令）

您可以看一下例如产生的汇编代码 gcc -S -fverbose-asm -O2 -march=native

^{（在某些情况下，特别是当struct xyz有数百个字段时，编译器甚至会memset为您的情况1和2合成对调用！）}

通常，通过以上方法1或2进行初始化是否会比方法3更快？

在实践中，答案通常是“否”（因此，首选最易读的方法）。如果您很在意，请对您的代码进行基准测试。

^{（不要忘记开发时间也要花钱；在许多情况下，您的人为之物所花的时间要比您可能会赢得的CPU纳秒多，而且通常不会）}

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-10

我来说两句

0 条评论

登录后参与评论

上一篇：将模型绑定到选定的值，而不是在项目上设置选定的值

TOP 榜单

文章

memset的速度vs直接分配为零

memset的速度vs直接分配为零

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u