举例来说,+8在计算机中表示为二进制的1000,那么-8怎么表示呢?
很容易想到,可以将一个二进制位(bit)专门规定为符号位,它等于0时就表示正数,等于1时就表示负数。比如,在8位机中,规定每个字节的最高位为符号位。那么,+8就是00001000,而-8则是10001000。
但是,随便找一本《计算机原理》,都会告诉你,实际上,计算机内部采用2的补码(Two's Complement)表示负数。
什么是2的补码?
它是一种数值的转换方法,要分二步完成:
第一步,每一个二进制位都取相反值,0变成1,1变成0。比如,00001000的相反值就是11110111。
第二步,将上一步得到的值加1。11110111就变成11111000。
所以,00001000的2的补码就是11111000。也就是说,-8在计算机(8位机)中就是用11111000表示。
不知道你怎么看,反正我觉得很奇怪,为什么要采用这么麻烦的方式表示负数,更直觉的方式难道不好吗?
昨天,我在一本书里又看到了这个问题,然后就花了一点时间到网上找资料,现在总算彻底搞明白了。
2的补码的好处
首先,要明确一点。计算机内部用什么方式表示负数,其实是无所谓的。只要能够保持一一对应的关系,就可以用任意方式表示负数。所以,既然可以任意选择,那么理应选择一种最方便的方式。
2的补码就是最方便的方式。它的便利体现在,所有的加法运算可以使用同一种电路完成。
还是以-8作为例子。
假定有两种表示方法。一种是直觉表示法,即10001000;另一种是2的补码表示法,即11111000。请问哪一种表示法在加法运算中更方便?
随便写一个计算式,16 + (-8) = ?
16的二进制表示是 00010000,所以用直觉表示法,加法就要写成:
00010000
+10001000
---------
10011000
可以看到,如果按照正常的加法规则,就会得到10011000的结果,转成十进制就是-24。显然,这是错误的答案。也就是说,在这种情况下,正常的加法规则不适用于正数与负数的加法,因此必须制定两套运算规则,一套用于正数加正数,还有一套用于正数加负数。从电路上说,就是必须为加法运算做两种电路。
现在,再来看2的补码表示法。
00010000
+11111000
---------
100001000
可以看到,按照正常的加法规则,得到的结果是100001000。注意,这是一个9位的二进制数。我们已经假定这是一台8位机,因此最高的第9位是一个溢出位,会被自动舍去。所以,结果就变成了00001000,转成十进制正好是8,也就是16 + (-8) 的正确答案。这说明了,2的补码表示法可以将加法运算规则,扩展到整个整数集,从而用一套电路就可以实现全部整数的加法。
2的补码的本质
在回答2的补码为什么能正确实现加法运算之前,我们先看看它的本质,也就是那两个步骤的转换方法是怎么来的。
要将正数转成对应的负数,其实只要用0减去这个数就可以了。比如,-8其实就是0-8。
已知8的二进制是00001000,-8就可以用下面的式子求出:
00000000
-00001000
---------
因为00000000(被减数)小于0000100(减数),所以不够减。请回忆一下小学算术,如果被减数的某一位小于减数,我们怎么办?很简单,问上一位借1就可以了。
所以,0000000也问上一位借了1,也就是说,被减数其实是100000000,算式也就改写成:
100000000
-00001000
---------
11111000
进一步观察,可以发现100000000 = 11111111 + 1,所以上面的式子可以拆成两个:
11111111
-00001000
---------
11110111
+00000001
---------
11111000
2的补码的两个转换步骤就是这么来的。
为什么正数加法适用于2的补码?
实际上,我们要证明的是,X-Y或X+(-Y)可以用X加上Y的2的补码完成。
Y的2的补码等于(11111111-Y)+1。所以,X加上Y的2的补码,就等于:
X + (11111111-Y) + 1
我们假定这个算式的结果等于Z,即 Z = X + (11111111-Y) + 1
接下来,分成两种情况讨论。
第一种情况,如果X小于Y,那么Z是一个负数。这时,我们就对Z采用2的补码的逆运算,求出它对应的正数绝对值,再在前面加上负号就行了。所以,
Z = -[11111111-(Z-1)] = -[11111111-(X + (11111111-Y) + 1-1)] = X - Y
第二种情况,如果X大于Y,这意味着Z肯定大于11111111,但是我们规定了这是8位机,最高的第9位是溢出位,必须被舍去,这相当于减去100000000。所以,
Z = Z - 100000000 = X + (11111111-Y) + 1 - 100000000 = X - Y
这就证明了,在正常的加法规则下,可以利用2的补码得到正数与负数相加的正确结果。换言之,计算机只要部署加法电路和补码电路,就可以完成所有整数的加法。
Z = X + (11111111-Y) + 1式子可以写为Z = X - Y +100000000,这在硬件上可以理解为两部分电路来实现,第一部分是前面的X - Y(这里姑且不管计算的结果是正还是负),第二部分是X - Y计算的结果再和100000000相加,最终得到计算的结果Z, 而在8位的计算机上100000000是不能出现的,其实这时100000000就相当于00000000(舍去了最高位),然后我们再看一些计算的过程:
Z = X + (11111111 - Y) + 1
= X - Y + 100000000
= X - Y + 00000000
= X - Y
这样我们就证明了X-Y或X+(-Y)可以用X加上Y的2的补码完成,而不必分两种情况来证明。
为什么会有补码?
在十进制中,如果最高位两位,那么(N - 25) 与 (N + 75)再去掉溢出位,结果是一样的。
在我们古老的哲学思想中,9为至,多过9就是溢则损,损多少呢,损了与75互补的一个数。所以如果N是26,就最多只能加73,加了74就没了,加75就变负的了。
补码的计算?
二进制:由于是二元的,求反加1就直接等于补码,不但步数是确定的,而且只要两步。
十进制:如果从1开始,那么到溢出就要加9,如果步长确定,步数就不确定,如果步数确定,步长就不确定。所以无法用统一的方式达成25到75的转换。
………………………………
有没有搞错,我只看过2本(随便挑了市面上最流行销量最好的的)C/C++语言教程,它们的第一章都会讲下数据的类型,基本内容什么的。
关于2的补码(哎呀不记得书里叫什么了)亦有很详细的解释,阮大讲到的内容其实都有写到,只是并非像阮大这样单独列出,而是在数据存储方式的负数存储里面提到。好像除了运算方便,还有一个避开长数据的单字节和双字节数据存储的冲突问题吧(实在记不清了)
sphinux同志,您看像我这样的只是为了考二级证才去学的人也记得有这么个东西,并且我觉得很简明扼要啊,本质也说得很清楚不会给我这个电白造成理解障碍…………我说您至于这么抵毁“国内的教材”嘛!!
"第一步,每一个二进制位都取相反值,0变成1,1变成0。比如,00001000的相反值就是11110111。"
这个也不对,符号位是不变的
比如"-8在计算机(8位机)中就是用11111000表示。" 是这么计算的
原码 10001000
反码 11110111
补码 11111000
这样计算才与引号的中的描述相一致;
之所以产生了上述的混乱是因为作者在“什么是2的补码?”这段的解释,并没有诠释为什么叫“2”的补码,因此就像我们在大学听老师解释补码时所说的,取反+1,现在回忆起来老师讲的是某个数的补码,比如-8的补码是多少,会产生如下的解释:
-8的源码是多少
符号位以外取反是多少
然后末尾+1
而这里作者所表达的其实是8的2的补码,也就是带着符号位取反+1,然后它的结果代表的是-8
所以两种表达,最后都是一个结果,但是一会儿前种说法,一会儿后种说法,本文夹杂了两种说法,并且说法的前提都没讲清楚,所以造成了我的混乱。
不知道第一次看这偏文章的人有没有这样的感觉,一会儿理解了,一会儿又混乱了,这是因为没有从根本上理解它。
不过作者的语言表达能力我觉得还是很强的,支持!
引用sphinux的发言:
感谢能有这样清楚明白的文章,比计算机专业解释的要好,因为简明扼要而又说清楚本质。问题是国内的教材里不会告诉你为什么,也没有兴趣去引导你发现为什么,总是先整一堆定义和定理,强行让人接受,再去应用到考试里,就这种态度和做法,首先就把很多潜在的兴趣和天份扼杀了
确实是这样!其实,学校里的老师可能也只是将一些理论,并不能(或者根本就不知道)以具体的实际例子来讲。实际例子能让人看到学习理论的希望,而不会决定茫然。
你是想说这个应该是-0吧?
首先8bit机,1bit符号位,最大整数是127,1000 0000肯定不是+128;
-0(1000 0000 正常想的)->取反 1111 1111 + 1 = 1 0000 0000(-0补码), 首位溢出不存,就是0000 0000;
-128: 1000 0000(128)->取反 0111 1111 + 1 = 1000 0000(-128补码)。
因为缺少符号位导致补码和原码混淆。具体解释如下:
1.使用补码表示符号数时必须带有符号位。在没有符号位的情况下,同一个补码对应的可能是一个负数,也可能是一个正数。
2.做加减运算时,补码只能和补码进行运算(废话:P),得到的结果当然还是补码。
OK!现在来看上面的问题,看看加上符号位后结果如何:
176-253=176+[-253]
176(补)=0 1011 0000 [-253](补)=1 0000 0011
176(补)+[-253](补)=1 1011 0011
1 1011 0011是一个负数,对应的原码正好是1 0100 1101=-77
因为缺少符号位导致补码和原码混淆。具体解释如下:
1.使用补码表示符号数时必须带有符号位。在没有符号位的情况下,同一个补码对应的可能是一个负数,也可能是一个正数。
2.做加减运算时,补码只能和补码进行运算(废话:P),得到的结果当然还是补码。
OK!现在来看上面的问题,看看加上符号位后结果如何:
176-253=176+[-253]
176(补)=0 1011 0000[-253](补)=1 0000 0011
176(补)+[-253](补)=1 1011 0011
1 1011 0011是一个负数,对应的原码正好是1 0100 1101=-77
看了一下原问题,再补充一点东西。
原问题中的推导:253(补)=00000010+1=00000011
-253=253(补)=00000011
是错误的。正数的补码与原码相同,负数的补码是其绝对值的原码按位取反后加一(包括符号位),
eg.[-253](补)=253(反)+1=0 1111 1101(反)+0 0000 0001=1 0000 0010+0 0000 0001=1 0000 0011
ps:对补码的一种比较形象的理解方式是参照钟表。以0点为原点,顺时针为正,逆时针为负,补码就是按照顺时针读出的结果。而其在数学上的对应物正是模运算。
你们的证明方法不算严谨的,譬如说普通十进制满足结合律,计算机这种最高位被舍去同样满足结合律吗,当然也要稍微说明一下的。
补码的定义可以根据 与相应正数相加为零从而得到,以四位数计算机为例。
十进制2被表示 0010,十进制数-2,对应补码数应该是 0010+x = 0000,也就是 0010+x=1 0000,解出x为1110,这就是-2的补码表示。
通过这种定义,假设十进制数为Y,对应二进制数为y,
则Y-Y=y+ (-Y的相应补码)=0。(根据定义)
因为两个正的十进制数相加,如果不溢出必然等于相对应两个二进制数相加,故
则任取一个正数Z,对应二进制位z则必然
Z+Y-Y=z+y+(-Y的相应补码),
令X=Z+Y,显然X对应二进制数位z+y (Z,Y都是正数)
即X是任意一个正数,且满足 X-Y=x+(-Y相应补码)
“第一种情况,如果X小于Y,那么Z是一个负数。这时,我们就对Z采用2的补码的逆运算,求出它对应的正数绝对值,再在前面加上负号就行了。所以,Z = -[11111111-(Z-1)] = -[11111111-(X + (11111111-Y) + 1-1)] = X - Y”
这里面既有10进制又有2进制的思想,感觉是碰巧凑出来的。不如用模的概念解释更友好。
----------------------
假设32位机器,X为负数(最高位是符号位,对于负数,即为1),则有X(绝对值)+X(反)=0xFFFFFFFFF,因此X(绝对值)+X(反)+1=0xFFFFFFFFF+1=0;所以得到0-X(绝对值)=X(反)+1,根据之前的定义X(反)+1即为X的补码,于是有X(补)=X(反)+1=0-X(绝对值);
----------------------
所以根据上述结论可以得出 a - b = a + (0 - b) = a + b补