在指针数组中进行转换和写入会报告使用 clang sanitizer 未对齐的地址

Kel*_*lno 1 c++

我使用 char* 数组来存储不同的数据类型,如下一个示例所示:

int main()
{
    char* arr = new char[8];
    *reinterpret_cast<uint32_t*>(&arr[1]) = 1u;
    return 0;
}
Run Code Online (Sandbox Code Playgroud)

用clang UndefinedBehaviorSanitizer编译运行会报如下错误:

runtime error: store to misaligned address 0x602000000011 for type 'uint32_t' (aka 'unsigned int'), which requires 4 byte alignment
Run Code Online (Sandbox Code Playgroud)

我想我可以用另一种方式来做,但为什么这是未定义的行为?这里涉及到哪些概念呢?

Mil*_*nek 5

您不能将任意值强制转换char*uint32_t*,即使它指向一个足够大的数组来容纳uint32_t

有几个原因。

实际的答案:

uint32_t一般喜欢4字节对齐:它的地址应该是4的倍数。

char没有这样的限制。它可以存在于任何地址。

这意味着任意值char*不太可能与 正确对齐uint32_t

语言律师回答:

除了对齐问题之外,您的代码还表现出未定义的行为,因为您违反了严格的别名规则。您正在写入的地址处不uint32_t存在任何对象,但您将其视为那里有一个对象。

一般来说, whilechar*可用于指向任何对象并读取其字节表示形式,而T*对于任何给定类型T, a不能用于指向字节数组并将对象的字节表示形式写入其中。


无论错误的原因是什么,修复方法都是相同的:

如果您不关心将字节视为 auint32_t并且只是将它们序列化(例如通过网络发送或写入磁盘),那么您可以将std::copy字节放入缓冲区:

char buffer[BUFFER_SIZE] = {};
char* buffer_pointer = buffer;
uint32_t foo = 123;
char* pfoo = reinterpret_cast<char*>(&foo);
std::copy(pfoo, pfoo + sizeof(foo), buffer_pointer);
buffer_pointer += sizeof(foo);
uint32_t bar = 234;
char* pbar = reinterpret_cast<char*>(&bar);
std::copy(pbar, pbar + sizeof(bar), buffer_pointer);
buffer_pointer += sizeof(bar);
// repeat as needed
Run Code Online (Sandbox Code Playgroud)

如果您确实想将这些字节视为(例如,uint32_t如果您正在实现类似的数据结构),那么您将需要确保缓冲区正确对齐,并使用placement-new:std::vector

std::aligned_storage_t<sizeof(uint32_t), alignof(uint32_t)> buffer[BUFFER_SIZE];
uint32_t foo = 123;
uint32_t* new_uint = new (&buffer[0]) uint32_t(foo);
uint32_t bar = 234;
uint32_t* another_new_uint = new (&buffer[1]) uint32_t(foo);
// repeat as needed
Run Code Online (Sandbox Code Playgroud)