位操作
位操作指的是对整数二进制表示的一元和二元操作,分为 位运算 和 移位 两类.位操作是 CPU 中最基础的一类运算,其速度往往是相当快的.
整数与位序列
我们将只由 0 或 1 构成的长度固定的序列称为位序列.最左边的位称为最高位,最右边的位称为最低位.
计算机中用位序列表示一定范围内的整数.长度为
-
对于无符号的对应关系,我们可以直接将整数的二进制表示作为位序列,长度不足就在高位补
0.在无符号的对应关系下,长度为
的位序列可以表示 内的整数. -
对于有符号的对应关系,我们有两种表示规则:反码(ones' complement)和 补码(two's complement).
对于非负整数来说,其表示规则和无符号的规则一致;对于负整数来说,我们将其相反数对应的位序列 按位取反(即将
0变为1,将1变为0)后的结果称为反码,将反码按无符号的对应关系转为整数,然后加一,最后按无符号的对应关系转为位序列,超出原位序列长度的部分舍弃,得到的新序列称为补码.在反码的对应关系下,长度为
的位序列可以表示 内的整数.在补码的对应关系下,长度为
的位序列可以表示 内的整数.
以
| 位序列 | 无符号整数 | 有符号整数(反码) | 有符号整数(补码) |
|---|---|---|---|
000 |
|||
001 |
|||
010 |
|||
011 |
|||
100 |
|||
101 |
|||
110 |
|||
111 |
可以看到反码的最大问题是会出现
将位序列转为整数也是容易做到的:对非负数来说不需要特别操作,对反码来说取反即可得到对应的相反数,对补码来说取反加一即可得到对应的相反数.
位运算
位运算指的是对位序列逐位应用某些 布尔函数 的运算.形式化地说,对布尔函数
的函数,其中
一般来说,我们把 按位取反、按位与、按位或、按位异或 视作基本的位运算,其余的位运算均可以通过这些运算组合得到.
| 位运算 | 数学符号表示 | 对应的布尔函数 | C++ 运算符 | 解释 |
|---|---|---|---|---|
| 按位取反 | ~ |
|||
| 按位与 | & |
只有两个对应位都为 |
||
| 按位或 | | |
只要两个对应位中有一个 |
||
| 按位异或 | ^ |
只有两个对应位不同时才为 |
Warning
注意区分位运算与布尔函数.
例如:
, , , .
由于上述四种位运算在运算时,各个位的运算独立,所以这四种位运算能直接继承其对应布尔函数的性质.
为方便起见,在位序列长度已知时,我们也可以直接对整数做位运算,例如:
假设
在不引起歧义的情况下,下文中省略「按位」.
移位
另请参阅:C++ 位操作符.
移位为一类将位序列「按位向左或向右移动」的二元运算,第一个参数为位序列,第二个参数一般为非负整数.向左移动称为 左移,向右移动称为 右移.根据对移动后的空位填充方式,可将移位操作分为 算术移位、逻辑移位、循环移位.其中
- 逻辑移位用 0 填充空位,
- 算术右移用符号位填充空位,算术左移和逻辑左移相同,
- 循环移位用溢出位填充空位.
例如对 10 01 01 10:
| 操作 | 结果 |
|---|---|
| 算术左移 |
01 01 10 00 |
| 算术右移 |
11 10 01 01 |
| 逻辑左移 |
01 01 10 00 |
| 逻辑右移 |
00 10 01 01 |
| 循环左移 |
01 01 10 10 |
| 循环右移 |
10 10 01 01 |
在 C++ 中,我们用 a << b 表示左移,a >> b 表示右移,具体采用何种移位规则参见 C++ 位操作符.
我们可以用如下代码实现循环移位:
实现
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | |
位操作的应用
位操作一般有三种作用:
- 高效地进行某些运算,代替其它低效的方式.参见 编译优化 #强度削减.
- 表示集合(常用于 状压 DP).
- 题目本来就要求进行位操作.
需要注意的是,用位操作代替其它运算方式在很多时候并不能带来太大的优化,反而会使代码变得复杂,使用时需要斟酌.
有关 2 的幂的应用
由于位操作针对的是二进制表示,因此可以推广出许多与 2 的整数次幂有关的应用.
将一个数乘(除)2 的非负整数次幂:
1 2 3 4 5 6 7 | |
1 2 3 4 5 6 | |
Warning
我们平常写的除法是向 -1 / 2 的值为 -1 >> 1 的值为
取绝对值
在某些机器上,效率比 n > 0 ? n : -n 高.
1 2 3 4 5 6 7 | |
1 2 3 4 5 6 7 8 | |
取两个数的最大/最小值
在某些机器上,效率比 a > b ? a : b 高.
1 2 3 4 | |
1 2 3 4 5 6 7 | |
判断两非零数符号是否相同
1 2 3 | |
1 2 3 | |
交换两个数
该方法具有局限性
这种方式只能用来交换两个整数,使用范围有限.
对于一般情况下的交换操作,推荐直接调用 algorithm 库中的 std::swap 函数.
1 | |
操作一个数的二进制位
获取一个数二进制的某一位:
1 2 | |
1 2 3 | |
将一个数二进制的某一位设置为
1 2 | |
1 2 3 | |
将一个数二进制的某一位设置为
1 2 | |
1 2 3 | |
将一个数二进制的某一位取反:
1 2 | |
1 2 3 | |
这些操作相当于将一个
汉明权重
汉明权重是一串符号中不同于(定义在其所使用的字符集上的)零符号(zero-symbol)的个数.对于一个二进制数,它的汉明权重就等于它 popcount).
求一个数的汉明权重可以循环求解:我们不断地去掉这个数在二进制下的最后一位(即右移
代码如下:
1 2 3 4 5 6 7 8 9 | |
求一个数的汉明权重还可以使用 lowbit 操作:我们将这个数不断地减去它的 lowbit1,直到这个数变为
代码如下:
1 2 3 4 5 6 7 8 9 | |
构造汉明权重递增的排列
在 状压 DP 中,按照 popcount 递增的顺序枚举有时可以避免重复枚举状态.这是构造汉明权重递增的排列的一大作用.
下面我们来具体探究如何在
我们知道,一个汉明权重为
而找出一个数
-
把
最右边的 向左移动,如果不能移动,移动它左边的 ,以此类推,得到 . -
把得到的
最后移动的 原先的位置一直到最低位的所有 都移到最右边.这里最后移动的 原来在第三位,所以最后三位 要变成 ,得到 .
这个过程可以用位操作优化:
1 2 | |
- 第一个步骤中,我们把数
加上它的lowbit,在二进制表示下,就相当于把 最右边的连续一段 换成它左边的一个 .如刚才提到的二进制数 ,它在加上它的lowbit后是 .这其实得到了我们答案的前半部分. - 我们接下来要把答案后面的
补齐, 的lowbit是 最右边连续一段 最左边的 移动后的位置,而 的lowbit则是 最右边连续一段 最右边的位置.还是以 为例, , , . - 接下来的除法操作是这种位操作中最难理解的部分,但也是最关键的部分.我们设 原数 最右边连续一段
最高位的 在第 位上(位数从 开始),最低位的 在第 位, 的lowbit等于1 << (r+1), 的lowbit等于1 << l,(((t&-t)/(x&-x))>>1)得到的,就是(1<<(r+1))/(1<<l)/2 = (1<<r)/(1<<l) = 1<<(r-l),在二进制表示下就是 后面跟上 个零,零的个数正好等于连续 的个数减去 .举我们刚才的数为例, .把这个数减去 得到的就是我们要补全的低位,或上原来的数就可以得到答案.
所以枚举
1 2 3 4 5 6 | |
其中要注意
C++ 中的相关类与函数
GCC 内建函数
GCC 中还有一些用于位操作的内建函数:
int __builtin_ffs(int x):返回 的二进制末尾最后一个 的位置,位置的编号从 开始(最低位编号为 ).当 为 时返回 .int __builtin_clz(unsigned int x):返回 的二进制的前导 的个数.当 为 时,结果未定义.int __builtin_ctz(unsigned int x):返回 的二进制末尾连续 的个数.当 为 时,结果未定义.int __builtin_clrsb(int x):当 的符号位为 时返回 的二进制的前导 的个数减一,否则返回 的二进制的前导 的个数减一.int __builtin_popcount(unsigned int x):返回 的二进制中 的个数.int __builtin_parity(unsigned int x):判断 的二进制中 个数的奇偶性.
这些函数都可以在函数名末尾添加 l 或 ll(如 __builtin_popcountll)来使参数类型变为 (unsigned)long 或 (unsigned)long long(返回值仍然是 int 类型).
例如,我们有时候希望求出一个数以二为底的对数,如果不考虑 0 的特殊情况,就相当于这个数二进制的位数 -1,而一个 N 位整数 n 的二进制表示的位数可以使用 N - __builtin_clz(n) 表示,因此 N - 1 - __builtin_clz(n) 就可以求出 n 以二为底的对数.
由于这些函数是内建函数,经过了编译器的高度优化,运行速度十分快(有些甚至只需要一条指令).
更多位数
如果需要操作的位序列非常长,可以使用 std::bitset.
题目推荐
参考资料与注释
- 位运算技巧
- Bit Operation Builtins (Using the GNU Compiler Collection (GCC))
- Bitwise operation - Wikipedia
本页面最近更新:2026/1/30 14:50:40,更新历史
发现错误?想一起完善? 在 GitHub 上编辑此页!
本页面贡献者:Ir1d, Tiphereth-A, ouuan, StudyingFather, greyqz, Link-cute, cjsoft, Marcythm, Enter-tainer, ksyx, lihaoyu1234, akakw1, Anguei, aofall, billchenchina, c-forrest, CCXXXI, Dian-Jiao, diauweb, Early0v0, flylai, Great-designer, H-J-Granger, Henry-ZHR, hhc0001, hjsjhn, iamtwz, Konano, Menci, MingqiHuang, orzAtalod, PlanariaIce, sakuragi1111, sbofgayschool, shawlleyw, Shen-Linwood, skippre, sshwy, stevenlele, TOMWT-qwq, Voileexperiments, Xeonacid, xinchengo, ylxmf2005, zhilu-tang, ZnPdCo, zryi2003
本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用