【C语言】自定义类型：结构体深入解析（三）结构体实现位段最终篇

文章目录

前言
什么是位段？
位段的内存分配
VS怎么开辟位段空间呢？
位段的跨平台问题
位段的应⽤
位段使⽤的注意事项
总结

前言

本小节，我们将学习结构体最后的知识：结构体实现位段，阿森将会和你一起去学习什么是位段？位段的内存分配，VS怎么开辟位段空间呢？位段跨平台问题，随即位段的应用，最后我们也要了解它的注意事项。文章干货满满，很容易理解，学习起来吧！

什么是位段？

位段是C语言中结构体的一种数据类型。

位段允许在结构体中定义具有指定位数的成员，这些成员可以占用结构体变量内部的连续比特位。

位段的声明和结构是类似的，有两个不同：

位段的成员必须是int ，usigned int 或 signed int,在C99中位段成员的类型也可以选择其他类型。
位段的成员后边有一个冒号和一个数字，这个数字代表了该成员变量在结构体内占用的bit位数。它用来限定成员变量的范围和存储空间。。

话不多说，给铁铁上两者比较代码：

struct A//位段{int _a : 2;int _b : 5;int _c : 10;int _d : 30;};struct B//结构体{int _a ;int _b ;int _c ;int _d ;};int main(){printf("位段A大小=%d\n", sizeof(struct A));printf("结构体B大小=%d\n", sizeof(struct B));return 0;}

输出：

分析：

首先看位段Struct A有4个成员，如int _a:2这个成员中，int是类型，_a是变量名【变量名包含字母（大小写均可），数字（但不能以数字开头），下划线，如良好的变量名userName，order_calculateResult】，：2指定该位段成员占用的bit位数为2个bit，以此类推就会明白_b，_c，_d的组成情况。既然知道了他的组成，那计算他的大小吧，Struct A的大小和为47bit（2+5+10+30=47bit），然后用编译器运行大小为8（这个8意思是八个字节，也等于8*8=64个比特位）。我们通过位段的一个成员一个成员加起来是47bit,而编译器计算出的是8个字节。

阿森小问：这8个字节是内存实际占用的吗？为什么编译器不显示47个bit，而是64个bit，是不是跟结构体一样存在内存对齐呢？通过内存对齐来此应对内存的节约呢？阿森小答：没错，节省空间是没错，用的是也是同结构体一样的内存对齐的实现方式：字节对齐，不过方法不同。对于编译器来说，最小的内存单元是字节，它不会返回非整字节的bit数，因此它是按字节为单位返回，打印8个字节。位段成员总和47bit，6字节（48bit）就可以了，怎么又要8（64bit）个字节了。通过结构体（128bit）与位段（64bit）对比，我们看出他的空间节省出来了，但是他不是无限制的节省空间，虽然节省了空间，但也有浪费，阿森一会讲解怎么浪费空间的。当然对于位段是要使用在特殊场景下，如在struct B中的int _a;假设他存储134,267这么大的整数那就不适合用位段，如果要存储0,1,2,3用2bit就可以完美的存储起来了。 0可以用00，1用01，2用10,3用11表示，而用int 存储可能需要32bit,节省了很多空间！那位段怎么实现内存分配，让47（bit）变成8（64bit）字节呢” /> 位段的内存分配
位段的成员可以是 int， unsigned int ，signed int 或者是 char 等类型。
位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的⽅式来开辟的。
位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使⽤位段。
用代码理解：
struct A{int _a : 2;int _b : 5;int _c : 10;int _d : 30;};
阿森把宝图解分析：

首先_a的类型是int ，申请了4个字节，开辟32bit空间，_a需要2bit，到底是从右边开始使用，还是从左边使用这两个空间开始的，这个是不确定的，标准C语言并没有给规定，这取决于编译器，注：这不是大小端问题。假设它从右向左，分配2个空间给_a(绿色)，然后再继续分配5个空间给_b（黄色），接着_c（蓝色）说我需要10bit，最后还剩下 15bit，接下来_d说我需要30个bit,15个bit不够，内存说：那就再给你开辟一个整形32个bit吧！然后他就存储完剩下的15bit，再存储新开辟的32bit里分配15bit继续存储，这是一种方式！当然也有第二种可能：剩下的我浪费掉，我不用，反正不够，那我在新开辟的空间里一些性存储完30个bit，这是不是一种方式。对于这个剩下的15个bit会不会使用，C语言有没有给规定，这也取决于编译器，VS是一种实现，gcc是一种实现，这就说明了位段有很多不确定因素，位段是不跨平台的，位段是如何开辟空间的，是严格依赖编译器的！注重可以植平台应该避免使用位段，如果要使用，应该明白其开辟空间原理，避免造成不必要的麻烦！
VS怎么开辟位段空间呢？
上代码来一起实战理解：
struct S{char a : 3;char b : 4;char c : 5;char d : 4;};int main(){struct S s = { 0 };s.a = 10;s.b = 8;s.c = 3;s.d = 4;printf("%d\n", sizeof(s));return 0;}
代码运行：

阿森双手把宝图奉上：

图解分析：
首先一上来给s的成员都初始化为0，也就是每个bit都初始化为0，s里的每个成员类型都是char，为了更好的理解他开辟的空间是什么样的？我们先开辟一个字节（8bit（两个黑色箭头处在同一字节处）），开辟好了，a占3个bit，是从2个黑色箭头往左使用，还是从开头往右使用的呢？剩余的空间不够了，是浪费，还是不浪费呢？这样子吧！我们先假设一种方案来：1. 从右向左使用，2.如果剩余的空间不够就直接使用下一个空间，浪费掉。
开始–>：先看两个箭头指向一个字节处，a是10，用二进制位表示01010（注：在x86环境下，整数10二进制表示方式为0000 1010，这里为了方便看，简写5为就能理解了），a要3bit，并没有把a全部存进去，从a取低位开始010，接着箭头移动三格，然后b要4bit，取1100，放进去，此时8bit只剩下1bit,根据我们定下的规则，如果剩余的空间不够，就浪费，使用下一个。好！接下来再开辟一个字节（8bit），黑色箭头指向下一个字节最右边，c你要5个bit,好！一下子满足你，此时发现8bit只剩下3bit了又不够，好！编译器说：再给你在内存空间里弄一个字节（8bit）吧,d要4bit,最后用了4bit,都存完了，总共3个字节。你可能说：有没有巧合呢？不充分吧！那阿森和你一起就调试起来看看内存和监视吧：
注意：在内存窗口我们看到是16进制存储方式，先把我们成员存储进去的bit进行16进制转换，再看内存。
拓展：2进制转16进制方式:
16进制的数字每⼀位是0~9, a ~f 的，0 ~9,a ~ f的数字，各⾃写成2进制，最多有4个2进制位就⾜够了，
如：2进制的01101011，换成16进制：0x6b，16进制表⽰的时候前⾯加0x

因此，我们把每个字节（8bit）划分2段4bit，然后再加上0x就可以；
第一个字节是前4位0110–>2^0+ 2^1+ 2^1+ 2^0=6，后4bit为0010–> 2^0+ 2^0 +2^1 + 2^0=2，剩下的都是同样方法，00000011表示0x03，00000100表示0x04，接下来看内存调试：

看出内存显示的确是62 03 04，一模一样。说明我们刚刚的方案是正确，符合VS的存储方式的：在一个字节内部存储数据从右向左使用，如果剩余的空间不够，就浪费。
代码输出：

分析结果：
这里可以看出开辟了3个字节，就可以把我们想存储的数据就存好了，如果没有位段的使用，用结构体要开辟4个char类型，多出来一个字节，相对来说节省了空间。
当你读到这里，你已经明白了VS对位段的开辟是怎么样操作的，此时让我们给自己鼓个掌，送给自己，继续加油！
阿森和你再理清这3个字节是不是一次性开辟的存储数据，还是创建完一个字节存储数据，再创建一个字节再存储数据的。
用图更容易理解：
s是编译器一次性开辟好的，然后再存储数据，文章中为了更好的理解他的流程，所以用了一个字节开辟一个字节开辟的存储的数据！

内存调试也可以方便观察：按F10调试内存来看看，给内存输入&s，当调试s的成员进行初始化为0时，内存显示3个字节变红了，都为0，后面cc代表着还未被初始化，为随机值（经典烫烫烫），可以看出在给一个成员s开辟内存空间时，编译器是一下子分配好的，不是开辟一个字节空间就存储数据，内存调试图在下↓
位段的跨平台问题
int 位段被当成有符号数还是⽆符号数是不确定的。
位段中最⼤位的数⽬不能确定。（16位机器最⼤16，32位机器最⼤32，写成27，在16位机器会出问题。
位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
当⼀个结构包含两个位段，第⼆个位段成员⽐较⼤，⽆法容纳于第⼀个位段剩余的位时，是舍弃
剩余的位还是利⽤，这是不确定的。
总结：
跟结构相⽐，位段可以达到同样的效果，并且可以很好的节省空间，但是有跨平台的问题存在。
位段的应⽤
下图是⽹络协议中，IP数据报的格式，我们可以看到其中很多的属性只需要⼏个bit位就能描述，这⾥使⽤位段，能够实现想要的效果，也节省了空间，这样⽹络传输的数据报⼤⼩也会较⼩⼀些，对⽹络的畅通是有帮助的。
IP数据报(IP Datagram)是IP(Internet Protocol)网络层协议传输的数据单元。
网络协议中ip数据报的格式：

IP数据报报头中的许多字段，其值的范围很小，只需要使用少量比特位就可以表示，这就适合使用位段表示。
比如说4位版本号版本号是不是给4bit就可以了？首部长度给4bit，服务类型给8bit，总长度给16bit，包括这个地方的标志位给上3bit就可以了，那像这种是不是实现这位段的形式更好一些？
什么叫ip数据报？简单地说一下，假设呢，你要聊天，说a要发一个信息给b。
假设我们的使用微信，你在微信上发了一个元旦快来啦，之后，你就一下子就发到b手机上去了吗，你只要把它扔到网络上，就发到b的手机去了，不是的。
首先发送数据时，不仅仅发送原始数据，还需要封装额外的控制信息，如版本号、长度、源地址、目的地址等，组成完整的IP数据报，这些控制字段使用位段表示，精确占用需要的比特位数，可以最大限度节省空间。源地址和目的地址决定数据报发往哪里，避免误发。
数据报大小合理，就像网络上车流量合理，可以提高传输效率(如果封装的13个数据都是int好比许多大车，传输效率慢，合理位段像不同的小车高效运行传输)

小尺寸的IP数据报更利于网络传输。因为网络传输的开销很大程度上取决于数据包的大小。
网络协议定义了数据报的格式，保证发送和接收双方都能正确理解数据内容。使用位段表示IP报头字段，可以有效减小IP数据报的大小，这对网络传输性能和通信效率都很有利。所以，位段就起到了一个很好的编解码方法，它可以帮助IP数据报更高效地使用报头空间，实现报头字段的最优编码。
这也是IP报头设计中广泛使用位段的重要原因。它可以很好地将IP数据报大小控制在一个合理范围内。
位段使⽤的注意事项
位段的⼏个成员共有同⼀个字节，这样有些成员的起始位置并不是某个字节的起始位置，那么这些位置处是没有地址的。
内存中每个字节分配⼀个地址，⼀个字节内部的bit位是没有地址的。所以不能对位段的成员使⽤&操作符，这样就不能使⽤scanf直接给位段的成员输⼊值，只能是先输⼊放在⼀个变量中，然后赋值给位段的成员。
代码：
struct A{int _a : 2;int _b : 5;int _c : 10;int _d : 30;};int main(){struct A sa = { 0 };scanf("%d", &sa._b);//这是错误的return 0;}
错误显示图：

正确方法：必须先将输入值存入有地址的普通变量中，然后赋值给位段成员。
例如先scanf输入一个整数到变量b,然后b的某几位赋值给位段成员。
正确代码：
struct A{int _a : 2;int _b : 5;int _c : 10;int _d : 30;};int main(){struct A sa = { 0 };//正确的⽰范int b = 0;scanf("%d", &b);sa._b = b;return 0;}
代码运行显示可运行输入图：

总结
这次阿森和你一起学习什么是位段？位段的内存分配，VS怎么开辟位段空间呢？位段的跨平台问题，位段的应⽤，位段使⽤的注意事项，阿森将下一节和你一起学习联合体和枚举。
感谢你的收看，如果文章有错误，可以指出，我不胜感激，让我们一起学习交流，如果文章可以给你一个小小帮助，可以给博主点一个小小的赞，也可以点个小小的关注哦