新浪新闻客户端

刘润对话吴军:信息时代,每个人都必须了解的基本常识

刘润对话吴军:信息时代,每个人都必须了解的基本常识
2020年11月26日 16:10 新浪网 作者 亿欧

  商业洞察丨作者 / 刘润   整理 /  由之

  在机械时代,关于物理世界的一些常识,只要学过中学物理,我们基本都了解。

  比如,速度不能超过光速。温度不会低于绝对零度(-273摄氏度)。发动机的效率不可能超过100%。

  正因为有了这些常识,大家就会知道做一件事情可以做到什么程度,比如汽车的效率能提升到多少。我们就不会去追求那些不可能达成的目标。

  但是,今天到了信息时代,关于信息有什么规律和常识,很多人其实是不了解的。

  因为不了解,所以就容易产生错误的判断。

  比如,一个会场的wifi网络每秒能传输10M的数据。如果同时上网的人特别多,大家会惯性地觉得,人多就多吧,只是平分到每个人身上的速度慢一点,比如100k/s,但总归是能上网的。

  其实,完全不是这样。

  当所有人传输的信息总量超过一个阈值,所有人都会上不了网。

  这是由香农第二定律决定的:

  如果信息传输率超过信道容量,就不可能实现可靠传输。这个时候,谁也传不出去任何信息。

  这就是信息时代的规律和常识。

  再比如,有人说,埃隆·马斯克发射了很多卫星,一旦覆盖全球通信,就能取代5G了。

  乍一听好像有点道理。

  但其实完全是两回事儿。

  因为,从卫星到地面的信道容量是很有限的,它可以用来解决南北极、珠穆朗玛峰等极端地区的通信问题,但是速度完全没法跟5G相比。

  很多人不了解信息时代的这些基本常识,所以才会有这种不切实际的对比。

  不切实际的对比倒也无伤大雅,但是有一部分人会去做一些不切实际的投资,甚至不切实际的创业。

  这其实就是在做类似超越光速的事情,永远都不可能达成目标,会浪费很多金钱和生命。

  类似的事情,在机械时代,大家因为了解物理常识,会嘲笑他是民科。

  但是在信息时代,很多人因为不了解信息常识,反而就会觉得他在创新。

  所以,为了让大家了解信息时代的基本常识,吴军老师写了一本书,叫做《信息传》。

  吴军老师是计算机科学家,是自然语言处理技术的先驱者,是谷歌公司的智能搜索科学家,腾讯公司的前副总裁,同时也是硅谷著名的风险投资人、畅销书作家。 

  他著有《数学之美》、《浪潮之巅》、《硅谷之谜》、《智能时代》、《文明之光》、《大学之路》、《全球科技通史》、《见识》、《态度》等,本本都是超级畅销书。从我到我儿子小米,我们全家都是他的书迷。 

  吴军老师的这本《信息传》,我一拿起来就放不下来了。

  因为它讲了很多信息时代的基本规律。

  比如,为什么一次性密码最安全?为什么量子通信今天这么热门?数据压缩到什么程度会有损耗?

  这些规律和常识,就相当于机械时代的牛顿三大定律一样重要,每个人都应该了解它们。

  拿到这本书后,我专门访谈了吴军老师,让他给我们公号的读者讲讲他的《信息传》。

  非常感谢吴军老师。

  今天,我就把这次访谈的内容,分享给你。

   1

  信息科学的发展,大致可以分为两个阶段。

  一个叫自发的时代,一个叫自觉的时代。

  在自发时代,虽然人类有了电报、电话、无线电、电视机以及机械计算机等信息技术的成就,但是人类并不了解信息的本质和规律,因此依然处在黑暗中的摸索阶段。

  在那个时候,哪怕是最好的科学家,也和今天的常人一样,在犯同样的错误。

  比如像特斯拉和巴贝奇这样的天才,他们完全无法明白自己的很多努力,其实完全走错了方向。

  特斯拉一直致力于用电磁波来传递能量,而特斯拉的竞争对手马可尼,则致力于用电磁波来传递信息。

  最终,马可尼的研究获得了诺贝尔奖,收获了巨大成功。

  到了今天,我们知道,用电磁波来传能量几乎是不太可能的,因为电磁场辐射衰减得很快,距离稍微远一点,就不剩下多少能量了。而用电磁波来传信息却是非常可行的。

  但是在那个时代,没有人了解信息的规律,大家都在黑暗中摸索前行。成功,具有很大的偶然性。

  与其说马可尼比特斯拉水平更高,不如说比他更加幸运,无意中做的一些事情,恰好契合了信息科学的发展。

  再比如,巴贝奇最早做计算机,其实就走错了方向。

  因为他并不清楚,越是复杂的信息处理,就越要用简单的基本模块去实现。

  在机械时代,大家普遍有一个误区:为了实现复杂的功能,就要把机器做得特别复杂。

  于是,巴贝奇把计算机设计得越来越复杂,用无数的齿轮来实现微积分,最后复杂到连做都做不出来了。

  再后来,香农在这个问题上,换了一种思路,他想着用最简单的模块,来搭建复杂的系统。这为后来电子计算机的诞生,奠定了基础。

  今天我们的所有电子产品,你把它拆开来看,芯片上都是一些很简单的功能模块,最底层的就是0和1的开关电路,只是数量很多而已。

  在自发时代,由于不了解信息的本质和规律,人们都在摸索中前行,盲打莽撞。

  直到香农用一个被称为“熵”的概念,和三个非常简洁的定律,描述了信息科学的本质。

  它们,就是我们今天所说的信息论的核心。

  信息时代的信息论,就像是机械时代的牛顿三大定律。

  有了信息论,所有的技术研究和发展就不再是凭运气,而是顺应规律。信息技术开始飞速发展。

  这就进入了信息科学的自觉时代。

  人类从此几乎没有再犯过什么大的错误,也没有走太多的弯路。

   2

  在自觉时代,我们要感谢三位非常重要的科学家,他们为今天的信息技术奠定了理论基础。

  第一位科学家,毫无疑问,就是香农。

  他做出的重要贡献之一,就是提出了著名的香农第二定律,解释了信息传输的规律。

  具体来说,就是:

  信息的传输率永远都不可能超过信道的容量。

  你可以把传输率理解为通信(上网)速度,也就是每秒能传输的信息量,比如200kb/s。

  信道的容量,你可以把它想象成高速公路的宽度。高速公路上行驶的汽车就相当于在信道中传输的信息。

  信息的传输率永远都不可能超过信道的容量,一旦超过,出错率就是100%,所有人都会无法通信。

  那么我们想要传输率更快,就要增加信道的容量。

  如何增加信道的容量?

  有两个办法。

  第一个办法:增加频率范围,也就是带宽。

  频率范围,就是带宽。比如100兆赫-200兆赫,就是一段频率范围。

  频率范围,也就是带宽越大,信道的容量越大。

  光纤通信相比无线电通信和电缆通信,信息传输率可以高出很多,根本原因就是它的带宽要比后两者宽了很多。

  光纤通信用的是可见光,而光的频率比无线电通信中电磁波的频率要高很多。

  同样是无线电通信,从1G到5G,它的频率是不断提高的。

  因为我们想要增加带宽,让频率范围往上走是有很大空间的,但是往下走的空间却很有限,最多频率降到零,但不可能是负的。

  4G的发射频率大概是2000兆赫。

  到了5G,发射频率增加到6000兆赫左右。美国下一代的还要到28000兆赫。

  增加信道容量的第二个办法,就是增加信噪比。

  信噪比越高,信道的容量越大。

  信噪比,顾名思义,就是信号和噪声的比值。

  想要信噪比越高,就要增加信号的强度,或者降低噪声。

  增加信号强度,可以从加大发射功率入手。

  但是这种做法是有极限的,比如我们的移动通信基站,功率太大会对周围的人造成辐射伤害,所以必须把它限制在安全范围内。

  在无线通信中,信号的强度会随着距离的增加而衰减,噪声则是恒定不衰减的。

  所以,想要在不增加功率的情况下,增加噪比,唯一的方式就是缩短通信的距离。

  这就是5G的基站要建得非常密集的原因之一。

  增加频率范围和增加信噪比,是增加信道容量的两个基本方向。

  从1G到5G,大家都是在朝着这两个方向走。所有关于5G的创新,其实都是在解决这两个方向上所遇到的工程问题。

  再过十几年,又会出现6G,6G也是在这两个方向上的进一步延伸。

  因为这是信息时代的基本规律,朝着这两个方向走,就不会有失败。

   3

  在自觉时代,我们要感谢的第二位科学家,叫做冯·诺依曼。

  冯·诺依曼,他解释了信息和运算的关系。

  信息不仅仅是用来传输的,我们想要让信息发挥更大的作用,还要解决另外两个问题:信息的运算和存储

  冯·诺依曼从工程学的角度,把信息的运算和存储切割开来,每一块单独设计,再结合在一起来实现计算机的完整计算功能。

  按照冯·诺依曼的设计思想,一台电子计算机应该包括计算器、控制器、存储器和输入输出设备,它是由程序自动控制的。

  这就是所谓的冯·诺依曼结构,这个结构是现代计算机的基础。

  今天所有关于计算机的研究工作,依然在冯·诺依曼所划定的框架内做改进。

  比如处理器是一个还是多个,存储器是少量的还是海量,处理器和存储器是单独放置还是做到一个芯片中,这些都是后来改进时需要考虑的问题了。

  当然,今天计算机的性能,已经和冯·诺依曼那个时代不可同日而语。

  全球第一台电子计算机ENIAC,是在1946年完工的。这台计算机占地近160平方米,每秒能运算5000次。

  到今天,你知道一台iPhone12,每秒能计算多少次吗?

  大概能计算200亿次。

  从每秒计算5000次,到每秒计算200亿次,是怎么实现的?

  这就是芯片的工艺问题了。

  芯片是由晶体管组成的,晶体管可以实现电门的开和关,也就对应着计算机中的0和1。

  一块芯片有多大的计算能力,就看这块芯片上的晶体管有多密集。

  以华为麒麟970和华为麒麟980为例。

  麒麟970是10纳米工艺的芯片,有55亿个晶体管。

  麒麟980是7纳米工艺的芯片,有69亿个晶体管。比麒麟970性能提升了25.5%左右。

  在同样大小的一块芯片里,7纳米工艺的芯片,比10纳米工艺的芯片能搭载更多的晶体管,技术更先进,性能更高。

  今天,台积电和三星的量产芯片可以做到7纳米,接下来将量产5纳米。

  所以,在冯·诺依曼提出计算机的结构之后,后人都是在这个结构的基础上改进技术和工艺。

  在信息的存储方面也是同样。

  怎么来解决信息的存储问题?

  最早是通过在纸带上打孔的方式,把运算过程记录下来。

  后来演变成磁带。

  比如我们小时候听歌时用的磁带,就是把歌曲的信息存储在了磁带上。

  再后来有了磁盘。

  我上小学四五年级的时候买过一张5寸的单面磁盘,当时花了8块钱,存储空间是180K。

  再后来,5寸磁盘演变成了3寸磁盘。

  再往后又演变成了硬盘。

  我高中时用过的第一台带硬盘的计算机,硬盘的存储空间是10M。

  到了我上大学,计算机的硬盘已经能达到1个G了。

  而今天,一部手机的存储空间,已经能达到512G。

  这就是存储的进步。

  这也是在冯·诺依曼结构的基础上,存储技术和工艺的改进。

   4

  在自觉时代,我们要感谢的第三位科学家,叫做图灵。

  他提出了著名的“图灵测试”,定义了数据和智能的关系:

  如果机器能够与人类展开对话而不被辨别出其机器身份,那么称这台机器具有智能。

  通过了图灵测试,就说明对方的智能是不是能达到人类的水平,而不一定非要模拟人类的思考行为。

  在过去,我们认为,数据产生信息,信息产生知识,知识产生智慧。

  但是图灵告诉我们说,不需要通过知识产生智慧,从数据就能够直接产生智慧。

  这是这么意思?

  我举个例子。

  如果让一个人来判断,路上的一个小动物是不是一只猫。人是怎么判断的?

  首先,你得先见过猫,你眼睛看到的所有东西,都是数据。

  接着,你的大脑从这些数据中收集到猫的一些信息:猫的眼睛是什么样,耳朵是什么样……

  然后,你总结出了一套知识:符合什么特征的动物,就是猫。

  于是,你就拥有了智慧:你看到一只猫,就能辨认出这是一只猫。

  这是从数据,到信息,到知识,到智慧。

  人类想要机器也拥有智慧,一开始也想让机器走这条路径。

  但是发现,这条路是走不通的。

  后来一想,不对,为什么一定要这么走呢?我们能不能从数据直接到智慧呢?

  于是,有人提出了一种算法,叫做深度学习。

  我拿1000万张猫的照片,让人工智能来看,这是不是猫?

  人工智能判断对了,我就告诉它对了。人工智能判断错了,我就告诉它错了。

  通过海量的反馈,让人工智能训练出一套有效的模型。

  一开始,它随机判断,准确率可能是1%。

  慢慢地,训练数据和反馈越来越多,准确率也慢慢提高。

  2%,5%,10%……最后准确率提高到95%,甚至98%。接近甚至超过人类的准确率。

  这个时候,模型就训练好了。

  人工智能就能够准确地判断这张照片上的动物,到底是不是猫。

  这就是从数据,直接到智慧。

  你给人工智能一张照片的数据,它虽然能判断照片上的动物是不是猫,但是它根本就不知道什么是猫。

  这就是今天的人工智能。

  图灵用图灵测试的方法让我们知道,我们应该怎么去对待数据,怎么去对待信息,怎么去对待知识,怎么去对待智慧。

  理解了这些,你才能理解人工智能时代的基本常识。

  最后的话

  今天的文章,我们给大家介绍了三个人。

  首先是香农,他解释了信息传输的规律。

  然后是冯·诺依曼,他解释了信息和运算的关系。

  最后是图灵,他定义了数据和智能的关系。

  理解了他们的理论,你才能了解今天信息时代的基本常识。

  而只有了解了这些常识,你才能在未来的工作、创业中,遵循信息时代的基本规律,不至于去追求一些永远不可能达成的目标。

  你做事情才能事半功倍。

  如果你想要了解更多信息时代的基本常识,推荐你去看吴军老师的新书《信息传》,非常精彩。

  最后,再次感谢吴军老师。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
信息时代信息传
权利保护声明页/Notice to Right Holders

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有