C中的位域操作

Question

C中的位域操作

在C中用单位测试和设置单个位的经典问题可能是最常见的中级编程技能之一.您可以使用简单的位掩码进行设置和测试

unsigned int mask = 1<<11;

if (value & mask) {....} // Test for the bit
value |= mask;    // set the bit
value &= ~mask;   // clear the bit

Run Code Online (Sandbox Code Playgroud)

一篇有趣的博客文章认为,这容易出错,难以维护,而且做法不佳.C语言本身提供了类型安全和可移植的位级访问:

typedef unsigned int boolean_t;
#define FALSE 0
#define TRUE !FALSE
typedef union {
        struct {
                boolean_t user:1;
                boolean_t zero:1;
                boolean_t force:1;
                int :28;                /* unused */
                boolean_t compat:1;     /* bit 31 */
        };
        int raw;
} flags_t;

int
create_object(flags_t flags)
{
        boolean_t is_compat = flags.compat;

        if (is_compat)
                flags.force = FALSE;

        if (flags.force) {
                [...]
        }
        [...]
}

Run Code Online (Sandbox Code Playgroud)

但这让我感到畏缩.

我的同事和我对此有趣的争论仍然没有得到解决.两种样式都有效,我保持经典的位掩码方法简单,安全,清晰.我的同事认为这是常见且容易的,但是bitfield联合方法值得额外的几行,以使其便携和安全.

对于任何一方,还有其他争论吗？特别是有一些可能的失败,也许是字节顺序,位掩码方法可能会错过,但结构方法是安全的？

Answer 1

Mat*_*hen 38

Bitfields并不像你想象的那样便携,因为"C不能保证机器字内字段的排序"(C书)

忽略这一点,正确使用,任何一种方法都是安全的.这两种方法还允许对整数变量进行符号访问.您可以争辩说bitfield方法更容易编写,但它也意味着需要查看更多代码.

我遇到了将代码移植到编译器的问题,其中愚蠢的位字段顺序是向后的.很烦人.我会坚持戴口罩,谢谢.:) (20认同)
没有“向后”，因为没有定义向前。远离。我很遗憾曾经使用位字段作为从数据字节数组中提取内存的方法。 (2认同)

Answer 2

pli*_*nth 29

如果问题是设置和清除位容易出错,那么正确的做法是编写函数或宏以确保正确执行.

// off the top of my head
#define SET_BIT(val, bitIndex) val |= (1 << bitIndex)
#define CLEAR_BIT(val, bitIndex) val &= ~(1 << bitIndex)
#define TOGGLE_BIT(val, bitIndex) val ^= (1 << bitIndex)
#define BIT_IS_SET(val, bitIndex) (val & (1 << bitIndex))

Run Code Online (Sandbox Code Playgroud)

如果您不介意val必须是左值,除了BIT_IS_SET之外,这使您的代码可读.如果这不会让你开心,那么你取出赋值,将它括起来并将其用作val = SET_BIT(val,someIndex); 这将是等同的.

真的,答案是考虑将你想要的东西与你想要的东西分离.

我建议在宏扩展中至少将 `bitIndex` 宏参数括起来：`#define SET_BIT(val, bitIndex) val |= (1 << (bitIndex))` 以避免在参数是表达式时出现潜在的优先级问题. (2认同)

Answer 3

Nor*_*sey 23

Bitfield很棒且易于阅读,但不幸的是C语言没有指定内存中位域的布局,这意味着它们对于处理磁盘格式或二进制线协议中的打包数据基本上没用.如果你问我,这个决定是C-Ritchie的一个设计错误本可以选择订单并坚持下去.

Answer 4

Dou*_* T. 19

你必须从作家的角度思考这个问题 - 了解你的观众.因此,需要考虑几个"受众".

首先是经典的C程序员,他们一生都在蒙着头脑,可以在睡梦中做到这一点.

第二个是newb,谁也不知道所有这些&和东西是什么.他们在上一份工作中编写了php编程,现在他们为你工作了.(我说这是一个做php的新手)

如果你写作是为了满足第一批观众(即全天的位掩码),你会让他们非常高兴,他们将能够保持蒙住眼睛的代码.但是,newb可能需要在能够维护代码之前克服大的学习曲线.他们需要了解二元运算符,如何使用这些运算来设置/清除位等等.你几乎可以肯定会遇到newb引入的bug,因为他/她需要所有这些才能让它工作.

另一方面,如果您编写以满足第二个受众,则newbs将更容易维护代码.他们将有更轻松的时间

 flags.force = 0;

Run Code Online (Sandbox Code Playgroud)

比

 flags &= 0xFFFFFFFE;

Run Code Online (Sandbox Code Playgroud)

并且第一批观众会变得脾气暴躁,但很难想象他们无法理解和维护新语法.搞砸了起来要困难得多.不会有新的错误,因为newb将更容易维护代码.你会得到一些讲座,讲述"在我的日子里,你需要一只稳定的手和一根磁化针来设置位......我们甚至都没有位掩码!" (感谢XKCD).

所以我强烈建议使用位掩码上的字段来保护你的代码.

要清除位掩码N,我会使用flags&=〜N; 这样做的好处是不受标志大小的限制.使用64位整数运行您的代码,并且您稍微scr*wed ... (5认同)
我真的不会考虑那么难以掩盖.在维基百科上阅读30分钟(或更少),你已经足够了解正在发生的事情. (2认同)

Answer 5

Jul*_*ano 14

根据ANSI C标准,联合使用具有未定义的行为,因此不应使用(或至少不被视为可移植).

根据ISO/IEC 9899:1999(C99)标准:

附件J - 可移植性问题:

1以下未指定:

- 在结构或联合中存储值时填充字节的值(6.2.6.1).

- 除了存储在(6.2.6.1)中的最后一个成员之外的联合成员的值.

6.2.6.1 - 语言概念 - 类型表示 - 概述:

6当值存储在结构或联合类型的对象中时,包括在成员对象中,对应于任何填充字节的对象表示的字节采用未指定的值.[42])结构或联合对象的值是永远不是陷阱表示,即使结构或联合对象的成员的值可能是陷阱表示.

7当值存储在union类型的对象的成员中时,对象表示的不对应于该成员但与其他成员对应的字节采用未指定的值.

所以,如果你想保持位域↔整数对应,并保持可移植性,我强烈建议你使用bitmasking方法,这与链接的博客文章相反,这并不是一个糟糕的做法.

附件 J 是非规范性的。另外，附件 J 说该值未指定，而不是像您声称的那样存在未定义的行为。（这是一个有争议的问题，因为它是非规范的）。6.2.6.1/7 指联合对象中不位于正在写入的子对象内的字节。通过一份缺陷报告澄清，写入一个工会成员并读取另一个成员的行为类似于类型双关；澄清的措辞出现在 C11 标准中（取消并取代了旧标准） (2认同)

Answer 6

Rod*_*ddy 10

比特场方法让你感到畏缩的是什么？

这两种技术都有它们的位置,我唯一的决定就是使用哪种技术:

对于简单的"一次性"位摆弄,我直接使用位运算符.

对于任何更复杂的东西 - 例如硬件寄存器映射,位域方法都会失败.

Bitfields更简洁易用(代价/略微/更冗长的写作.
Bitfields更健壮(无论如何,大小是"int")
位域通常与按位运算符一样快.
当您混合使用单个和多个位字段时,位域非常强大,并且提取多位字段涉及大量手动移位.
Bitfields实际上是自我记录的.通过定义结构并因此命名元素,我知道它的意图.
Bitfields还可以无缝地处理大于单个int的结构.
对于按位运算符,典型(坏)实践是位掩码的大量#defines.
有关位域的唯一警告是确保编译器确实将对象打包成您想要的大小.我不记得这是否由标准定义,因此断言(sizeof(myStruct)== N)是一个有用的检查.

Answer 7

Aid*_*ell 6

无论哪种方式,位域已经在GNU软件中使用了几十年,并没有对它们造成任何伤害.我喜欢它们作为函数的参数.

我认为位域是常规的而不是结构.每个人都知道如何将值设置为各种选项,并且编译器将其归结为CPU上非常有效的按位操作.

如果您以正确的方式使用掩码和测试,编译器提供的抽象应该使其健壮,简单,可读和干净.

当我需要一组开/关开关时,我将继续在C中使用它们.

Answer 8

qrd*_*rdl 6

您所指的博客文章提到了rawunion字段作为bitfields的替代访问方法.

博客文章作者使用的目的raw是可以的,但是如果你计划将其用于其他任何事情(例如位字段的序列化,设置/检查单个位),灾难只是在等待你.内存中位的排序依赖于体系结构,内存填充规则因编译器而异(参见维基百科),因此每个位域的确切位置可能不同,换句话说,您永远无法确定raw每个位域的哪个位对应.

但是,如果你不打算混合它,你最好取出raw它,你将是安全的.

@Aiden,我认为他的观点是原始字段和(匿名)结构成员之间的映射是高度依赖于平台的.过去,我已经在嵌入式项目中被严重烧毁,只是试图编写一个与寄存器的数据表描述相匹配的结构.事实上#$ @(&*制造商编号为位0使得高位比特当然没有任何帮助! (2认同)

Answer 9

Ein*_*ein 6

那么结构映射就不会出错,因为这两个字段都是可访问的,它们可以互换使用.

位字段的一个好处是您可以轻松地聚合选项:

mask = USER|FORCE|ZERO|COMPAT;

vs

flags.user = true;
flags.force = true;
flags.zero = true;
flags.compat = true;

Run Code Online (Sandbox Code Playgroud)

在诸如处理协议选项的某些环境中,必须单独设置选项或使用多个参数来运送中间状态以实现最终结果.

但有时设置flag.blah并在IDE中设置列表弹出窗口非常棒,特别是如果您喜欢我并且不记得要设置的标志名称而不经常引用列表.

我个人有时会回避声明布尔类型,因为在某些时候我最终会误以为我刚刚切换的字段与其他"看似"的r/w状态不相关(思考多线程并发)碰巧共享相同32位字的无关字段.

我的投票是,它取决于具体情况,在某些情况下,这两种方法都可能很有效.

Answer 10

Ste*_*sop 5

在C++中,只需使用std::bitset<N>.

Answer 11

Dan*_*nas 5

是的，它很容易出错。我在这种代码中看到过很多错误，主要是因为有些人觉得他们应该以完全无组织的方式弄乱它和业务逻辑，从而造成维护噩梦。他们认为“真正的”程序员可以在任何value |= mask;地方编写，value &= ~mask;甚至更糟糕的东西，这没关系。如果当时有一些增量运算符、几个'、指针转换以及任何晦涩且容易出错的语法恰好出现在他们的脑海中，那就更好了。当然，不需要保持一致，您可以以两种或三种不同的方式翻转位，随机分布。memcpy

我的建议是：

将其封装在一个类中，使用诸如SetBit(...)和之类的方法ClearBit(...)。（如果您在模块中没有 C 语言的类。）当您这样做时，您可以记录它们的所有行为。

对该类或模块进行单元测试。

归档时间：	16 年，7 月前
查看次数：	52969 次
最近记录：	9 年，5 月前