关于2的补码 - 阮一峰的网络日志

举例来说，+8在计算机中表示为二进制的1000，那么-8怎么表示呢？

很容易想到，可以将一个二进制位（bit）专门规定为符号位，它等于0时就表示正数，等于1时就表示负数。比如，在8位机中，规定每个字节的最高位为符号位。那么，+8就是00001000，而-8则是10001000。

但是，随便找一本《计算机原理》，都会告诉你，实际上，计算机内部采用2的补码（Two's Complement）表示负数。

什么是2的补码？

它是一种数值的转换方法，要分二步完成：

第一步，每一个二进制位都取相反值，0变成1，1变成0。比如，00001000的相反值就是11110111。

第二步，将上一步得到的值加1。11110111就变成11111000。

所以，00001000的2的补码就是11111000。也就是说，-8在计算机（8位机）中就是用11111000表示。

不知道你怎么看，反正我觉得很奇怪，为什么要采用这么麻烦的方式表示负数，更直觉的方式难道不好吗？

昨天，我在一本书里又看到了这个问题，然后就花了一点时间到网上找资料，现在总算彻底搞明白了。

2的补码的好处

首先，要明确一点。计算机内部用什么方式表示负数，其实是无所谓的。只要能够保持一一对应的关系，就可以用任意方式表示负数。所以，既然可以任意选择，那么理应选择一种最方便的方式。

2的补码就是最方便的方式。它的便利体现在，所有的加法运算可以使用同一种电路完成。

还是以-8作为例子。

假定有两种表示方法。一种是直觉表示法，即10001000；另一种是2的补码表示法，即11111000。请问哪一种表示法在加法运算中更方便？

随便写一个计算式，16 + (-8) = ?

16的二进制表示是 00010000，所以用直觉表示法，加法就要写成：

０００１００００
＋１０００１０００
－－－－－－－－－
１００１１０００

可以看到，如果按照正常的加法规则，就会得到10011000的结果，转成十进制就是-24。显然，这是错误的答案。也就是说，在这种情况下，正常的加法规则不适用于正数与负数的加法，因此必须制定两套运算规则，一套用于正数加正数，还有一套用于正数加负数。从电路上说，就是必须为加法运算做两种电路。

现在，再来看2的补码表示法。

０００１００００
＋１１１１１０００
－－－－－－－－－
１００００１０００

可以看到，按照正常的加法规则，得到的结果是100001000。注意，这是一个9位的二进制数。我们已经假定这是一台8位机，因此最高的第9位是一个溢出位，会被自动舍去。所以，结果就变成了00001000，转成十进制正好是8，也就是16 + (-8) 的正确答案。这说明了，2的补码表示法可以将加法运算规则，扩展到整个整数集，从而用一套电路就可以实现全部整数的加法。

2的补码的本质

在回答2的补码为什么能正确实现加法运算之前，我们先看看它的本质，也就是那两个步骤的转换方法是怎么来的。

要将正数转成对应的负数，其实只要用0减去这个数就可以了。比如，-8其实就是0-8。

已知8的二进制是00001000，-8就可以用下面的式子求出：

００００００００
－００００１０００
－－－－－－－－－

因为00000000（被减数）小于0000100（减数），所以不够减。请回忆一下小学算术，如果被减数的某一位小于减数，我们怎么办？很简单，问上一位借1就可以了。

所以，0000000也问上一位借了1，也就是说，被减数其实是100000000，算式也就改写成：

１００００００００
－００００１０００
－－－－－－－－－
１１１１１０００

进一步观察，可以发现100000000 = 11111111 + 1，所以上面的式子可以拆成两个：

１１１１１１１１
－００００１０００
－－－－－－－－－
１１１１０１１１
＋０００００００１
－－－－－－－－－
１１１１１０００

2的补码的两个转换步骤就是这么来的。

为什么正数加法适用于2的补码？

实际上，我们要证明的是，X-Y或X+(-Y)可以用X加上Y的2的补码完成。

Y的2的补码等于(11111111-Y)+1。所以，X加上Y的2的补码，就等于：

X + (11111111-Y) + 1

我们假定这个算式的结果等于Z，即 Z = X + (11111111-Y) + 1

接下来，分成两种情况讨论。

第一种情况，如果X小于Y，那么Z是一个负数。这时，我们就对Z采用2的补码的逆运算，求出它对应的正数绝对值，再在前面加上负号就行了。所以，

Z = -[11111111-(Z-1)] = -[11111111-(X + (11111111-Y) + 1-1)] = X - Y

第二种情况，如果X大于Y，这意味着Z肯定大于11111111，但是我们规定了这是8位机，最高的第9位是溢出位，必须被舍去，这相当于减去100000000。所以，

Z = Z - 100000000 = X + (11111111-Y) + 1 - 100000000 = X - Y

这就证明了，在正常的加法规则下，可以利用2的补码得到正数与负数相加的正确结果。换言之，计算机只要部署加法电路和补码电路，就可以完成所有整数的加法。

Z = X + (11111111-Y) + 1式子可以写为Z = X - Y +100000000，这在硬件上可以理解为两部分电路来实现，第一部分是前面的X - Y（这里姑且不管计算的结果是正还是负），第二部分是X - Y计算的结果再和100000000相加，最终得到计算的结果Z, 而在8位的计算机上100000000是不能出现的，其实这时100000000就相当于00000000（舍去了最高位），然后我们再看一些计算的过程：
Z = X + （11111111 - Y) + 1
= X - Y + 100000000
= X - Y + 00000000
= X - Y
这样我们就证明了X-Y或X+(-Y)可以用X加上Y的2的补码完成，而不必分两种情况来证明。

为什么会有补码？
在十进制中，如果最高位两位，那么(N - 25) 与 (N + 75)再去掉溢出位，结果是一样的。
在我们古老的哲学思想中，9为至，多过9就是溢则损，损多少呢，损了与75互补的一个数。所以如果N是26，就最多只能加73，加了74就没了，加75就变负的了。
补码的计算？
二进制：由于是二元的，求反加1就直接等于补码，不但步数是确定的，而且只要两步。
十进制：如果从1开始，那么到溢出就要加9，如果步长确定，步数就不确定，如果步数确定，步长就不确定。所以无法用统一的方式达成25到75的转换。

………………………………
有没有搞错，我只看过2本（随便挑了市面上最流行销量最好的的）C/C++语言教程，它们的第一章都会讲下数据的类型，基本内容什么的。
关于2的补码（哎呀不记得书里叫什么了）亦有很详细的解释，阮大讲到的内容其实都有写到，只是并非像阮大这样单独列出，而是在数据存储方式的负数存储里面提到。好像除了运算方便，还有一个避开长数据的单字节和双字节数据存储的冲突问题吧（实在记不清了）
sphinux同志，您看像我这样的只是为了考二级证才去学的人也记得有这么个东西，并且我觉得很简明扼要啊，本质也说得很清楚不会给我这个电白造成理解障碍…………我说您至于这么抵毁“国内的教材”嘛！！

"第一步，每一个二进制位都取相反值，0变成1，1变成0。比如，00001000的相反值就是11110111。"
这个也不对,符号位是不变的
比如"-8在计算机（8位机）中就是用11111000表示。" 是这么计算的
原码 10001000
反码 11110111
补码 11111000
这样计算才与引号的中的描述相一致;

之所以产生了上述的混乱是因为作者在“什么是2的补码？”这段的解释，并没有诠释为什么叫“2”的补码，因此就像我们在大学听老师解释补码时所说的，取反+1，现在回忆起来老师讲的是某个数的补码，比如-8的补码是多少，会产生如下的解释：
-8的源码是多少
符号位以外取反是多少
然后末尾+1

而这里作者所表达的其实是8的2的补码，也就是带着符号位取反+1，然后它的结果代表的是-8

所以两种表达，最后都是一个结果，但是一会儿前种说法，一会儿后种说法，本文夹杂了两种说法，并且说法的前提都没讲清楚，所以造成了我的混乱。

不知道第一次看这偏文章的人有没有这样的感觉，一会儿理解了，一会儿又混乱了，这是因为没有从根本上理解它。

不过作者的语言表达能力我觉得还是很强的，支持！

引用sphinux的发言：

感谢能有这样清楚明白的文章，比计算机专业解释的要好，因为简明扼要而又说清楚本质。问题是国内的教材里不会告诉你为什么，也没有兴趣去引导你发现为什么，总是先整一堆定义和定理，强行让人接受，再去应用到考试里，就这种态度和做法，首先就把很多潜在的兴趣和天份扼杀了

确实是这样！其实，学校里的老师可能也只是将一些理论，并不能（或者根本就不知道）以具体的实际例子来讲。实际例子能让人看到学习理论的希望，而不会决定茫然。

你是想说这个应该是-0吧？
首先8bit机，1bit符号位，最大整数是127，1000 0000肯定不是+128；
-0（1000 0000 正常想的）->取反 1111 1111 + 1 = 1 0000 0000（-0补码）, 首位溢出不存，就是0000 0000；
-128： 1000 0000（128）->取反 0111 1111 + 1 = 1000 0000（-128补码）。

因为缺少符号位导致补码和原码混淆。具体解释如下：
1.使用补码表示符号数时必须带有符号位。在没有符号位的情况下，同一个补码对应的可能是一个负数，也可能是一个正数。
2.做加减运算时，补码只能和补码进行运算（废话:P），得到的结果当然还是补码。
OK！现在来看上面的问题，看看加上符号位后结果如何：
176-253=176+[-253]
176(补)=0 1011 0000 [-253](补)=1 0000 0011
176(补)+[-253](补)=1 1011 0011
1 1011 0011是一个负数，对应的原码正好是1 0100 1101=-77

因为缺少符号位导致补码和原码混淆。具体解释如下：
1.使用补码表示符号数时必须带有符号位。在没有符号位的情况下，同一个补码对应的可能是一个负数，也可能是一个正数。
2.做加减运算时，补码只能和补码进行运算（废话:P），得到的结果当然还是补码。
OK！现在来看上面的问题，看看加上符号位后结果如何：
176-253=176+[-253]
176(补)=0 1011 0000[-253](补)=1 0000 0011
176(补)+[-253](补)=1 1011 0011
1 1011 0011是一个负数，对应的原码正好是1 0100 1101=-77

看了一下原问题，再补充一点东西。
原问题中的推导：253(补)=00000010+1=00000011
-253=253(补)=00000011
是错误的。正数的补码与原码相同，负数的补码是其绝对值的原码按位取反后加一（包括符号位），
eg.[-253](补)=253(反)+1=0 1111 1101(反)+0 0000 0001=1 0000 0010+0 0000 0001=1 0000 0011
ps:对补码的一种比较形象的理解方式是参照钟表。以0点为原点，顺时针为正，逆时针为负，补码就是按照顺时针读出的结果。而其在数学上的对应物正是模运算。

你们的证明方法不算严谨的，譬如说普通十进制满足结合律，计算机这种最高位被舍去同样满足结合律吗，当然也要稍微说明一下的。

补码的定义可以根据与相应正数相加为零从而得到，以四位数计算机为例。
十进制2被表示 0010，十进制数-2，对应补码数应该是 0010+x = 0000，也就是 0010+x=1 0000，解出x为1110，这就是-2的补码表示。
通过这种定义，假设十进制数为Y，对应二进制数为y，
则Y-Y=y+ (-Y的相应补码)=0。（根据定义）
因为两个正的十进制数相加，如果不溢出必然等于相对应两个二进制数相加，故
则任取一个正数Z，对应二进制位z则必然
Z+Y-Y=z+y+(-Y的相应补码)，
令X=Z+Y，显然X对应二进制数位z+y (Z,Y都是正数)
即X是任意一个正数，且满足 X-Y=x+(-Y相应补码)

“第一种情况，如果X小于Y，那么Z是一个负数。这时，我们就对Z采用2的补码的逆运算，求出它对应的正数绝对值，再在前面加上负号就行了。所以，Z = -[11111111-(Z-1)] = -[11111111-(X + (11111111-Y) + 1-1)] = X - Y”

这里面既有10进制又有2进制的思想，感觉是碰巧凑出来的。不如用模的概念解释更友好。

----------------------

假设32位机器，X为负数(最高位是符号位，对于负数，即为1)，则有X(绝对值)+X(反)=0xFFFFFFFFF，因此X(绝对值)+X(反)+1=0xFFFFFFFFF+1=0；所以得到0-X(绝对值)=X(反)+1，根据之前的定义X(反)+1即为X的补码，于是有X(补)=X(反)+1=0-X(绝对值)；

----------------------

所以根据上述结论可以得出 a - b = a + (0 - b) = a + b补