在研究一个算法时, 我们多采用时空复杂度来衡量优劣, 然而实际生产环境中高效的代码往往不仅取决于优秀的算法,考虑硬件执行、缓存命中等特点对代码进行深入优化也很重要, 这其中就包括了内存对齐----"用空间换时间", 指令的对齐优化编译器已经帮我们考虑了, 而数据变量的对齐就需要程序员去设计了.
一般来讲, 访问未对齐的内存(misaligned access)轻则影响效率, 重则引发异常(包括指令执行异常和结构体对齐不正常引发的逻辑BUG等), 总之内存对齐是程序员尤其是C/C++程序员不得不重视的一个问题. MSVC++提供了两种对齐杂注,__declspec(align(#))和#pragma pack, 而在C++11标准中也加入了描述符alignas用于对齐控制, 本文主要简单解释下前面两种杂注的区别, 权当作者学习笔记.
这里我们要声明一个概念, 那就是对齐大小, 一般来说简单变量(内建类型)的对齐大小就是本身的大小, 其他变量(用户定义的复合变量, 如struct)则取决于声明具体类型时的具体杂注.
简单来讲, 以作用于结构体struct为例, #pragma pack用于控制结构体成员间的对齐, 而__declspec(align(#))则用于控制整个struct结构的对齐.
#pragma pack(n)要求n为1、2、4、8或16, 在未来出现256位变量的时候估计就可以指定32了.
1.第一个成员永远放置在[0...Size1)的大小为Size1的内存块(即[0]号内存开始的位置), 当只有一个成员或者所有成员的对齐大小都一致的时候不需要对齐, 整个结构的大小就是那些成员的大小总和, 此时n指定多少均不会改变struct整体占用大小.
2.否则就预留[0...Size1...n)的大小为n内存块(其中[Size1...n)这块内存是补齐出来的), 注意第一个成员是否完全占用这块大小为n的内存还要看之后的成员.
3.然后如果前面预留的[Size1...n)补齐内存块中间存在一处的内存地址是第二个成员对齐大小的倍数, 那么第二个成员就放置在这个内存地址开始的位置, 否则就放在[n]号内存开始的位置.
4.以此类推,重复上述步骤, 注意最后一个成员占用的大小要么为整个结构体成员中最大的对齐大小(当此值小于n时), 要么为n(当n小于整个结构体成员中最大的对齐大小时).
__declspec(align(#))则只要求#为2的整数次幂, 作用主要有两个方面
1.在结构体成员按#pragma pack确定内存布局之后, 在末尾填充内存使得整个结构的大小sizeof(struct)至少是#的整数倍.
2.作用于变量声明时, 强制要求编译器将变量放置在地址是#的整数倍的内存位置上, 这点在调用Native API等要求严格对齐的方法时十分重要, 当然动态分配时需要使用诸如_aligned_malloc等分配器才能确保正确对齐.
最后多说一句, 毋庸置疑windows编程最好最详细的文档库就是MSDN, 没有之一(推荐优先英文版, 一是有些文档没有中文版本, 二是由于机器翻译有些地方中文反而难以理解), 上面也做了MSDN相关文档的链接, 以方便有需要的读者查阅.