位操作

位操作指的是对整数二进制表示的一元和二元操作，分为 位运算 和移位两类．位操作是 CPU 中最基础的一类运算，其速度往往是相当快的．

整数与位序列

我们将只由 0 或 1 构成的长度固定的序列称为位序列．最左边的位称为最高位，最右边的位称为最低位．

计算机中用位序列表示一定范围内的整数．长度为 $N$ 的位序列只有 $2^{N}$ 种，所以只能和 $2^{N}$ 个整数建立一一对应关系．这种一一对应关系可以分为两类：有符号 和 无符号．有符号指的是对应的整数有负数，无符号指的是对应的整数全部为非负数．

对于无符号的对应关系，我们可以直接将整数的二进制表示作为位序列，长度不足就在高位补 0．

在无符号的对应关系下，长度为 $N$ 的位序列可以表示 $[0, 2^{N} - 1]$ 内的整数．
对于有符号的对应关系，我们有两种表示规则：反码（ones' complement）和补码（two's complement）．

对于非负整数来说，其表示规则和无符号的规则一致；对于负整数来说，我们将其相反数对应的位序列 按位取反（即将 0 变为 1，将 1 变为 0）后的结果称为反码，将反码按无符号的对应关系转为整数，然后加一，最后按无符号的对应关系转为位序列，超出原位序列长度的部分舍弃，得到的新序列称为补码．

在反码的对应关系下，长度为 $N$ 的位序列可以表示 $[- 2^{N - 1} + 1, 2^{N - 1} - 1]$ 内的整数．

在补码的对应关系下，长度为 $N$ 的位序列可以表示 $[- 2^{N - 1}, 2^{N - 1} - 1]$ 内的整数．

以 $3$ 位的位序列为例：

位序列	无符号整数	有符号整数（反码）	有符号整数（补码）
`000`	$0$	$0$	$0$
`001`	$1$	$1$	$1$
`010`	$2$	$2$	$2$
`011`	$3$	$3$	$3$
`100`	$4$	$- 3$	$- 4$
`101`	$5$	$- 2$	$- 3$
`110`	$6$	$- 1$	$- 2$
`111`	$7$	$- 0$	$- 1$

可以看到反码的最大问题是会出现 $- 0$ 这个实际上不存在的「负数」，所以一般情况下我们只用补码．由于表示有符号整数时，其正负号仅由位序列的最高位决定，所以我们将这一位称为 符号位．

将位序列转为整数也是容易做到的：对非负数来说不需要特别操作，对反码来说取反即可得到对应的相反数，对补码来说取反加一即可得到对应的相反数．

位运算

位运算指的是对位序列逐位应用某些布尔函数的运算．形式化地说，对布尔函数 $f : B^{k} \to B$ ，位运算即为形如

\begin{aligned} F : {(B^{m})}^{k} & \to B^{m} \\ ((p_{1, 1}, \dots, p_{m, 1}), \dots, (p_{1, k}, \dots, p_{m, k})) & \mapsto (f (p_{1, 1}, \dots, p_{1, k}), \dots, f (p_{m, 1}, \dots, p_{m, k})) \end{aligned}

的函数，其中 $m$ 为位序列的长度．同样的，我们一般只研究一元和二元的位运算．如无特殊说明，下文的位运算仅限于一元和二元的情况．

一般来说，我们把 按位取反、按位与、按位或、按位异或 视作基本的位运算，其余的位运算均可以通过这些运算组合得到．

位运算	数学符号表示	对应的布尔函数	C++ 运算符	解释
按位取反	$NOT$	$\neg$	`~`	$0$ 变为 $1$ ， $1$ 变为 $0$
按位与	$AND$	$\land$	`&`	只有两个对应位都为 $1$ 时才为 $1$
按位或	$OR$	$\lor$	`\|`	只要两个对应位中有一个 $1$ 时就为 $1$
按位异或	$\oplus$ 、 $XOR$	$\oplus$	`^`	只有两个对应位不同时才为 $1$

Warning

注意区分位运算与布尔函数．

例如：

$NOT 01010111 = 10101000$ ，
$01010011 AND 00110010 = 00010010$ ，
$01010011 OR 00110010 = 01110011$ ，
$01010011 XOR 00110010 = 01100001$ ．

由于上述四种位运算在运算时，各个位的运算独立，所以这四种位运算能直接继承其对应布尔函数的性质．

为方便起见，在位序列长度已知时，我们也可以直接对整数做位运算，例如：

\begin{aligned} NOT 5 & = - 6, \\ NOT (- 5) & = 4, \\ 5 AND 6 & = 4, \\ 5 OR 6 & = 7, \\ 5 XOR 6 & = 3. \end{aligned}

假设 $x, y \geq 0$ ，我们也可以将位运算用求和的方式表示：

\begin{aligned} NOT x & = \sum_{n = 0}^{⌊ \log_{2} x ⌋} 2^{n} ((⌊ \frac{x}{2^{n}} ⌋ mod 2 + 1) mod 2) \\ = \sum_{n = 0}^{⌊ \log_{2} x ⌋} (2^{⌊ \log_{2} x ⌋ + 1} - 1 - x) \\ x AND y & = \sum_{n = 0}^{⌊ \log_{2} max {x, y} ⌋} 2^{n} (⌊ \frac{x}{2^{n}} ⌋ mod 2) (⌊ \frac{y}{2^{n}} ⌋ mod 2) \\ x OR y & = \sum_{n = 0}^{⌊ \log_{2} max {x, y} ⌋} 2^{n} ((⌊ \frac{x}{2^{n}} ⌋ mod 2) + (⌊ \frac{y}{2^{n}} ⌋ mod 2) - (⌊ \frac{x}{2^{n}} ⌋ mod 2) (⌊ \frac{y}{2^{n}} ⌋ mod 2)) \\ x XOR y & = \sum_{n = 0}^{⌊ \log_{2} max {x, y} ⌋} 2^{n} (((⌊ \frac{x}{2^{n}} ⌋ mod 2) + (⌊ \frac{y}{2^{n}} ⌋ mod 2)) mod 2) \\ = \sum_{n = 0}^{⌊ \log_{2} max {x, y} ⌋} 2^{n} ((⌊ \frac{x}{2^{n}} ⌋ + ⌊ \frac{y}{2^{n}} ⌋) mod 2) \end{aligned}

在不引起歧义的情况下，下文中省略「按位」．

移位

另请参阅：C++ 位操作符．

移位为一类将位序列「按位向左或向右移动」的二元运算，第一个参数为位序列，第二个参数一般为非负整数．向左移动称为左移，向右移动称为右移．根据对移动后的空位填充方式，可将移位操作分为 算术移位、逻辑移位、循环移位．其中

逻辑移位用 0 填充空位，
算术右移用符号位填充空位，算术左移和逻辑左移相同，
循环移位用溢出位填充空位．

例如对 $8$ 位的位序列 10 01 01 10：

操作	结果
算术左移 $2$ 位	`01 01 10 00`
算术右移 $2$ 位	`11 10 01 01`
逻辑左移 $2$ 位	`01 01 10 00`
逻辑右移 $2$ 位	`00 10 01 01`
循环左移 $2$ 位	`01 01 10 10`
循环右移 $2$ 位	`10 10 01 01`

在 C++ 中，我们用 a << b 表示左移，a >> b 表示右移，具体采用何种移位规则参见 C++ 位操作符．

我们可以用如下代码实现循环移位：

实现

// From <https://stackoverflow.com/a/776523/224132>
#include <climits>
#include <cstdint>

uint32_t rotl32(uint32_t value, unsigned int count) {
  const unsigned int mask = CHAR_BIT * sizeof(value) - 1;
  count &= mask;
  return (value << count) | (value >> (-count & mask));
}

uint32_t rotr32(uint32_t value, unsigned int count) {
  const unsigned int mask = CHAR_BIT * sizeof(value) - 1;
  count &= mask;
  return (value >> count) | (value << (-count & mask));
}

位操作的应用

位操作一般有三种作用：

高效地进行某些运算，代替其它低效的方式．参见编译优化 #强度削减．
表示集合（常用于状压 DP）．
题目本来就要求进行位操作．

需要注意的是，用位操作代替其它运算方式在很多时候并不能带来太大的优化，反而会使代码变得复杂，使用时需要斟酌．

有关 2 的幂的应用

由于位操作针对的是二进制表示，因此可以推广出许多与 2 的整数次幂有关的应用．

将一个数乘（除）2 的非负整数次幂：

C++Python

int mulPowerOfTwo(int n, int m) {  // 计算 n*(2^m)
  return n << m;
}

int divPowerOfTwo(int n, int m) {  // 计算 n/(2^m)
  return n >> m;
}

def mulPowerOfTwo(n, m):  # 计算 n*(2^m)
    return n << m


def divPowerOfTwo(n, m):  # 计算 n/(2^m)
    return n >> m

Warning

我们平常写的除法是向 $0$ 取整，而这里的右移是向下取整（注意这里的区别），即当数大于等于 $0$ 时两种方法等价，当数小于 $0$ 时会有区别，如：-1 / 2 的值为 $0$ ，而 -1 >> 1 的值为 $- 1$ ．

取绝对值

在某些机器上，效率比 n > 0 ? n : -n 高．

C++Python

int Abs(int n) {
  return (n ^ (n >> 31)) - (n >> 31);
  /* n>>31 取得 n 的符号，若 n 为正数，n>>31 等于 0，若 n 为负数，n>>31 等于 -1
    若 n 为正数 n^0=n, 数不变，若 n 为负数有 n^(-1)
    需要计算 n 和 -1 的补码，然后进行异或运算，
    结果 n 变号并且为 n 的绝对值减 1，再减去 -1 就是绝对值 */
}

def Abs(n):
    return (n ^ (n >> 31)) - (n >> 31)
    """
    n>>31 取得 n 的符号，若 n 为正数，n>>31 等于 0，若 n 为负数，n>>31 等于 -1
    若 n 为正数 n^0=n, 数不变，若 n 为负数有 n^(-1)
    需要计算 n 和 -1 的补码，然后进行异或运算，
    结果 n 变号并且为 n 的绝对值减 1，再减去 -1 就是绝对值
    """

取两个数的最大/最小值

在某些机器上，效率比 a > b ? a : b 高．

C++Python

// 如果 a >= b, (a - b) >> 31 为 0，否则为 -1
int max(int a, int b) { return (b & ((a - b) >> 31)) | (a & (~(a - b) >> 31)); }

int min(int a, int b) { return (a & ((a - b) >> 31)) | (b & (~(a - b) >> 31)); }

# 如果 a >= b, (a - b) >> 31 为 0，否则为 -1
def max(a, b):
    return b & ((a - b) >> 31) | a & (~(a - b) >> 31)


def min(a, b):
    return a & ((a - b) >> 31) | b & (~(a - b) >> 31)

判断两非零数符号是否相同

C++Python

bool isSameSign(int x, int y) {  // 有 0 的情况例外
  return (x ^ y) >= 0;
}

# 有 0 的情况例外
def isSameSign(x, y):
    return (x ^ y) >= 0

交换两个数

该方法具有局限性

这种方式只能用来交换两个整数，使用范围有限．

对于一般情况下的交换操作，推荐直接调用 algorithm 库中的 std::swap 函数．

void swap(int& a, int& b) { a ^= b ^= a ^= b; }

操作一个数的二进制位

获取一个数二进制的某一位：

C++Python

// 获取 a 的第 b 位，最低位编号为 0
int getBit(int a, int b) { return (a >> b) & 1; }

# 获取 a 的第 b 位，最低位编号为 0
def getBit(a, b):
    return (a >> b) & 1

将一个数二进制的某一位设置为 $0$ ：

C++Python

// 将 a 的第 b 位设置为 0 ，最低位编号为 0
int unsetBit(int a, int b) { return a & ~(1 << b); }

# 将 a 的第 b 位设置为 0 ，最低位编号为 0
def unsetBit(a, b):
    return a & ~(1 << b)

将一个数二进制的某一位设置为 $1$ ：

C++Python

// 将 a 的第 b 位设置为 1 ，最低位编号为 0
int setBit(int a, int b) { return a | (1 << b); }

# 将 a 的第 b 位设置为 1 ，最低位编号为 0
def setBit(a, b):
    return a | (1 << b)

将一个数二进制的某一位取反：

C++Python

// 将 a 的第 b 位取反 ，最低位编号为 0
int flapBit(int a, int b) { return a ^ (1 << b); }

# 将 a 的第 b 位取反 ，最低位编号为 0
def flapBit(a, b):
    return a ^ (1 << b)

这些操作相当于将一个 $32$ 位整型变量当作一个长度为 $32$ 的布尔数组．

汉明权重

汉明权重是一串符号中不同于（定义在其所使用的字符集上的）零符号（zero-symbol）的个数．对于一个二进制数，它的汉明权重就等于它 $1$ 的个数（即 popcount）．

求一个数的汉明权重可以循环求解：我们不断地去掉这个数在二进制下的最后一位（即右移 $1$ 位），维护一个答案变量，在除的过程中根据最低位是否为 $1$ 更新答案．

代码如下：

// 求 x 的汉明权重
int popcount(int x) {
  int cnt = 0;
  while (x) {
    cnt += x & 1;
    x >>= 1;
  }
  return cnt;
}

求一个数的汉明权重还可以使用 lowbit 操作：我们将这个数不断地减去它的 lowbit¹，直到这个数变为 $0$ ．

代码如下：

// 求 x 的汉明权重
int popcount(int x) {
  int cnt = 0;
  while (x) {
    cnt++;
    x -= x & -x;
  }
  return cnt;
}

构造汉明权重递增的排列

在状压 DP 中，按照 popcount 递增的顺序枚举有时可以避免重复枚举状态．这是构造汉明权重递增的排列的一大作用．

下面我们来具体探究如何在 $O (n)$ 时间内构造汉明权重递增的排列．

我们知道，一个汉明权重为 $n$ 的最小的整数为 $2^{n} - 1$ ．只要可以在常数时间构造出一个整数汉明权重相等的后继，我们就可以通过枚举汉明权重，从 $2^{n} - 1$ 开始不断寻找下一个数的方式，在 $O (n)$ 时间内构造出 $0 \sim n$ 的符合要求的排列．

而找出一个数 $x$ 汉明权重相等的后继有这样的思路，以 $(10110)_{2}$ 为例：

把 $(10110)_{2}$ 最右边的 $1$ 向左移动，如果不能移动，移动它左边的 $1$ ，以此类推，得到 $(11010)_{2}$ ．
把得到的 $(11010)_{2}$ 最后移动的 $1$ 原先的位置一直到最低位的所有 $1$ 都移到最右边．这里最后移动的 $1$ 原来在第三位，所以最后三位 $010$ 要变成 $001$ ，得到 $(11001)_{2}$ ．

这个过程可以用位操作优化：

  int t = x + (x & -x);
  x = t | ((((t & -t) / (x & -x)) >> 1) - 1);

第一个步骤中，我们把数 $x$ 加上它的 lowbit，在二进制表示下，就相当于把 $x$ 最右边的连续一段 $1$ 换成它左边的一个 $1$ ．如刚才提到的二进制数 $(10110)_{2}$ ，它在加上它的 lowbit 后是 $(11000)_{2}$ ．这其实得到了我们答案的前半部分．
我们接下来要把答案后面的 $1$ 补齐， $t$ 的 lowbit 是 $x$ 最右边连续一段 $1$ 最左边的 $1$ 移动后的位置，而 $x$ 的 lowbit 则是 $x$ 最右边连续一段 $1$ 最右边的位置．还是以 $(10110)_{2}$ 为例， $t = (11000)_{2}$ ， $lowbit (t) = (01000)_{2}$ ， $lowbit (x) = (00010)_{2}$ ．
接下来的除法操作是这种位操作中最难理解的部分，但也是最关键的部分．我们设原数最右边连续一段 $1$ 最高位的 $1$ 在第 $r$ 位上（位数从 $0$ 开始），最低位的 $1$ 在第 $l$ 位， $t$ 的 lowbit 等于 1 << (r+1)， $x$ 的 lowbit 等于 1 << l，(((t&-t)/(x&-x))>>1) 得到的，就是 (1<<(r+1))/(1<<l)/2 = (1<<r)/(1<<l) = 1<<(r-l)，在二进制表示下就是 $1$ 后面跟上 $r - l$ 个零，零的个数正好等于连续 $1$ 的个数减去 $1$ ．举我们刚才的数为例， $\frac{lowbit (t) / 2}{lowbit (x)} = \frac{(00100)_{2}}{(00010)_{2}} = (00010)_{2}$ ．把这个数减去 $1$ 得到的就是我们要补全的低位，或上原来的数就可以得到答案．

所以枚举 $0 \sim n$ 按汉明权重递增的排列的完整代码为：

  for (int i = 0; (1 << i) - 1 <= n; i++) {
    for (int x = (1 << i) - 1, t; x <= n; t = x + (x & -x),
             x = x ? (t | ((((t & -t) / (x & -x)) >> 1) - 1)) : (n + 1)) {
      // 写下需要完成的操作
    }
  }

其中要注意 $0$ 的特判，因为 $0$ 没有相同汉明权重的后继．

C++ 中的相关类与函数

GCC 内建函数

GCC 中还有一些用于位操作的内建函数：

int __builtin_ffs(int x)：返回 $x$ 的二进制末尾最后一个 $1$ 的位置，位置的编号从 $1$ 开始（最低位编号为 $1$ ）．当 $x$ 为 $0$ 时返回 $0$ ．
int __builtin_clz(unsigned int x)：返回 $x$ 的二进制的前导 $0$ 的个数．当 $x$ 为 $0$ 时，结果未定义．
int __builtin_ctz(unsigned int x)：返回 $x$ 的二进制末尾连续 $0$ 的个数．当 $x$ 为 $0$ 时，结果未定义．
int __builtin_clrsb(int x)：当 $x$ 的符号位为 $0$ 时返回 $x$ 的二进制的前导 $0$ 的个数减一，否则返回 $x$ 的二进制的前导 $1$ 的个数减一．
int __builtin_popcount(unsigned int x)：返回 $x$ 的二进制中 $1$ 的个数．
int __builtin_parity(unsigned int x)：判断 $x$ 的二进制中 $1$ 个数的奇偶性．

这些函数都可以在函数名末尾添加 l 或 ll（如 __builtin_popcountll）来使参数类型变为 (unsigned)long 或 (unsigned)long long（返回值仍然是 int 类型）．例如，我们有时候希望求出一个数以二为底的对数，如果不考虑 0 的特殊情况，就相当于这个数二进制的位数 -1，而一个 N 位整数 n 的二进制表示的位数可以使用 N - __builtin_clz(n) 表示，因此 N - 1 - __builtin_clz(n) 就可以求出 n 以二为底的对数．

由于这些函数是内建函数，经过了编译器的高度优化，运行速度十分快（有些甚至只需要一条指令）．

题目推荐

Luogu P1225 黑白棋游戏

参考资料与注释

一个数二进制表示从低往高的第一个 $1$ 连同后面的零，如 $(1010)_{2}$ 的 lowbit 是 $(0010)_{2}$ ，详见树状数组． ↩

本页面最近更新：2026/1/30 14:50:40，更新历史
发现错误？想一起完善？在 GitHub 上编辑此页！
本页面贡献者：Ir1d, Tiphereth-A, ouuan, StudyingFather, greyqz, Link-cute, cjsoft, Marcythm, Enter-tainer, ksyx, lihaoyu1234, akakw1, Anguei, aofall, billchenchina, c-forrest, CCXXXI, Dian-Jiao, diauweb, Early0v0, flylai, Great-designer, H-J-Granger, Henry-ZHR, hhc0001, hjsjhn, iamtwz, Konano, Menci, MingqiHuang, orzAtalod, PlanariaIce, sakuragi1111, sbofgayschool, shawlleyw, Shen-Linwood, skippre, sshwy, stevenlele, TOMWT-qwq, Voileexperiments, Xeonacid, xinchengo, ylxmf2005, zhilu-tang, ZnPdCo, zryi2003
本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供，附加条款亦可能应用

位操作

整数与位序列

位运算

移位

位操作的应用

有关 2 的幂的应用

取绝对值

取两个数的最大/最小值

判断两非零数符号是否相同

交换两个数

操作一个数的二进制位

汉明权重

构造汉明权重递增的排列

C++ 中的相关类与函数

GCC 内建函数

更多位数

题目推荐

参考资料与注释