简介

  • 书名:《信息简史》
  • 作者: 詹姆斯·格雷克
  • 分类: 历史-历史文化
  • ISBN:9787115331809
  • 出版社:人民邮电出版社

概述

人类与信息遭遇的历史由来已久。詹姆斯·格雷克笔下的这段历史出人意料地从非洲的鼓语讲起。非洲土著部落在尚未直接跨越到移动电话之前,曾用鼓声来传递讯息,但他们是如何做到的呢?后续章节进而讲述了这段历史上几个影响深远的关键事件,包括文字的发明、罗伯特·考德里的第一本英语词典、查尔斯·巴贝奇的差分机与爱达·拜伦的程序、沙普兄弟的信号塔与摩尔斯电码。但人类开始自觉地理解和利用信息始于克劳德·香农在1948年创立的信息论。香农的信息论不仅推动了信息技术的发展,也引发了许多学科的信息转向,改变了人们对于诸如麦克斯韦妖、生命的编码、模因、随机性、量子信息论等的理解。部分科学家甚至认为,构成世界的基础不是物质,不是能量,而是信息。正如物理学家约翰·惠勒所说,“万物源自比特”。现如今,信息如洪流般淹没了我们,使我们深陷信息焦虑、信息过载、信息疲劳的困扰。但回顾历史,这并不是件新鲜事,人们也总是能想出应对手段。维基百科、Google便是我们的应对之一。无论对于信息的未来持何态度,有一点是确定无疑的,即我们人类是信息的造物。

划线

我们称为过去的东西其实是由比特构成的。

在这三十年间,信息极大地释放了人类的能量,它所创造的价值超过了之前五千年的财富总和

在这三十年间,产业化的信息就像一部两百迈的汽车行驶在未来之路上,但我们并不知道它要开往何方。

它对“冗余信息的价值”给出了不同以往的解释。那些看似有损于精炼和简洁的冗余信息反而提升了信息传播的精准性。而今,当我们对碎片化、无序化的信息头痛不已时,我们是否意识到,在依托大数据系统的组织与传播模式下,碎片可以为我们描绘出事物的全貌?

当对话取代听讲,当个性取代共性,当封闭转向开放,人的思想力得到了空前的释放,信息成为了社会的第一生产力。

但其实更为重要的,互联网所打破的实际是以纸书为代表的知识凝聚与传播方式

也许当我们忘记书是“一本本”的时候,我们才会看到互联网时代图书的未来。

“科技的互联网”不能描述信息的全部,信息只有作用于思维,才能显示出强大的力量。

信息则成为第一位的资源,其地位远超出传统的生产资料。

这本书可以让人多一个视角来看待和理解世界,即“信息视角”。

(1)信息贯穿了人类的发展史,今天的成果是过去一点点积累而来的;(2)计算通信理论突破后,带来的近五十年的变革是指数级的;(3)我们正在走向下一个指数级阶段,即信息世界和物理世界的统一融合。

生物体中的所有细胞都是一个错综复杂的通信网络中的节点,它们一刻不停地传输和接受信息,不停地编码和解码。进化本身正是生物体与环境之间持续不断的信息交换的具体表现。

:它不仅微小,而且抽象——它存在于一个个二进制数字、一个个触发器、一个个“是”或“否”的判断里

而解开这个谜团的关键就是不见于经典物理学的所谓量子纠缠(quantum entanglement)现象。一旦粒子之间或量子系统之间发生了量子纠缠,那么即便相隔广袤的时空,它们的基本属性也仍然相互关联。即使相隔数光年,它们仍然能够共享某些实际存在,但又不只是实际存在那么简单的东西。

信息吞噬者——黑洞。惠勒因而宣称:“未来,我们将学会用信息的语言去理解和表达全部物理学。”

很少有信息技术会彻底过时,每一种新兴技术都会为其前辈技术赋予新的理解

(这种编码后来被称为点-划字母表,但没有提及的停顿也同等重要,因此,摩尔斯电码并不是一种二进制语言。

但它也要解决与设计电报编码时所面临的同样问题,即怎样将整个语言映射到单一维度的最简单的一连串鼓声上。这个设计问题是经过一代代鼓手、数个世纪的社会演进才得到解决的。

音素

非洲语言的口语把声调作为举足轻重的一部分,鼓语则更进一步——它仅使用声调。这是种只有一对音素的语言,完全通过高低音的变化构成。鼓的原材料和制作手艺各有不同。比如,梆鼓(slit gong)就是取一段花梨木,掏成中空,再切出个长而狭的口子,就可以一端发高音而另一端发低音;还有一些鼓是蒙皮的,可以成对使用

引入冗余,不言而喻,效率肯定会打折扣,但它是避免混淆的一剂良药,它提供了第二次机会。

他眼见洛克勒族的年轻人中练习敲鼓的人越来越少,而上学的孩子们甚至连鼓语中的名字也没有了。他为此感到十分惋惜,因为对他而言,会说话的鼓已经成了他生活中的一部分

“森林里的白种男人精灵,回来回来,回到属于森林里的白种男人精灵的高高的木屋。女人和洋芋在等待着你。回来回来。”

文字成了我们获取知识的机制和组织思维的手段。我们希望采用历史和逻辑的方法来理解文字的起源,可是历史和逻辑本身就是文字思维的产物。

柏拉图是第一个长期受益于这项技术的人,本不太可能成为反技术的卢德分子,但他(借不立文字的苏格拉底之口)警告说,文字带来的将是思想的贫瘠:你这个发明结果会使学会文字的人们善忘,因为他们就不再努力记忆了。他们就信任文字,只凭外在的符号再认,并非凭内在的脑力回忆。所以你所发明的这剂药,只能医再认,不能医记忆。至于教育,你所拿给你的学生们的东西只是真实界的形似,而不是真实界的本身。

口语符号,会立刻消弭于无形。即使它真的存在,也只存在于听到了这些符号的人的思维中。

文字的持久性使得他能够把有关这个世界的已有知识加以结构化,进而他可以总结关于知识的知识。

群众无法接受美的观念本身,只知道各种美的事物。他们也不会思考事物的本质,只能理解各种具体事物。因此,群众不可能成为哲学家。

这些泥板不仅记录下了处于萌芽时期的商业和官僚政治的日常活动,而且也是最初使这些活动得以出现的条件。

杰恩斯评论说:“征服和影响之所以能够层层推进,正是借助了前所未有的众多字母、泥板和石碑。文字是进行社会控制的新方法,实际上,其模式也是今天我们基于备忘录进行沟通的政府的开端。

听觉空间是有机的、综合的,通过所有感官的同步互动才能感受到;而‘理性空间’或图文空间则是单一的、序列化的、连续的,它制造的是一个封闭世界,其中缺失了部落时代的回音世界里那种丰富的回声。

扉页上没有写作者罗伯特·考德里的名字,却写了一条拉丁文格言——“不理解不如不读”(Legere, et non intelligere, neglegere est)

:“外国人和外族人对于我们文字的不确定性以及我们拼写的随意性确实感到十分惊奇

”从此以后,语言再也不像空气那样看不见摸不着了。

“千万不要借用外国语”,“花点心思去使用常见的词来说话,只有这样,才能让大多数未受过教育的人听得懂”,

有些出过远门的绅士,回到家乡以后,除了爱穿外国的奇装异服四处招摇外,还喜欢在说话时夹杂外语。比如最近从法国归来者,就满口带法国腔的英语,并且也居然不以为耻。

所谓字母表,就是一个离散的小型符号集,有其约定俗成的排列顺序(“abecedarie,字母的前后顺序,或使用字母的人”)。但即便在当时,这种机制在人们看来是不自然的,因为它迫使读者将信息从单词的意义中剥离出来,把单词严格地视为字符串,集中精力于单词的字母组合上。

但是没有人知道英语中有多少单词。

一旦他们创造了一个新说法,任何人都可能听见

,巴贝奇的雄心也在高涨。动工十年后,巴贝奇的机器只有0.61米高,有六根轮轴、数十个数轮,可以进行六位数的运算。但再过十年后,机器的规模(虽然只是在图纸上)已经达到4.53立方米,重15吨,有25000个零件,而图纸平铺开来能覆盖超过37平方米的面积

而当他展望未来时,他预见有一条真理将高于一切,那就是“知识就是力量”。他是从字面上理解这句话的,认为知识“本身是物理作用力的发生器”

速度可以用两种方式度量:以距离来度量,或以符号和字词来度量。

这种将意义从一种抽象转换为另一种抽象的过程,在数学中早已有之。并且从某一方面上说,这恰是数学的本质所在。

而在对保密性要求不那么高的场合,韦尔建议将常用短语加以缩写。比如,在要发送“give my love to”(请问候某人)时,他建议只发送gmlt即可。他还给出了更多的例子:

那些使用电报编码的用户慢慢发现,编码虽然高效而简洁,但它也有始料未及的副作用,那就是极易受到哪怕是最微小的错误的破坏。由于缺乏一般的英语散文(乃至扼要的电报体散文)所天然具有的冗余度,这些经过精心编码的讯息,可能会因为一个字符或点划的差异而面目全非。

1.婴儿是不讲逻辑的;2.没有一个会调教鳄鱼的人被鄙视;3.不讲逻辑的人被鄙视。

在第一次世界大战后,麻省理工学院成为了美国电气工程应用科学的三大孵化中心之一,另两个是贝尔电话实验室和通用电气

数学家还倾向于把他们面对的任何情况都加以理想化。他的气体是“理想气体”,他的导体是“全导体”,他的表面是“光滑表面”。他会把这称为“直抵本质”,工程师则恐怕会说这是“无视事实”。

而讯息接收者知道该过程使用的密钥,从而可以借此反推整个替换过程。因此,即便敌方知道了所用的加密过程,只要密钥没有泄露,整套安全系统仍然有效

在香农看来,模式就等同于冗余。在日常语言中,冗余可以辅助理解。可在密码分析中,冗余就是密码的阿喀琉斯之踵。

信息是不确定性,是出人意料,是困难程度,是熵。

就像用移动物体所需的力来定义质量一样。不过换个角度看,质量的确可以用这种方式定义。●信息是熵。这是各个说法当中最奇怪也最强大的一个。熵的概念早已有之,在研究热量和能量的热力学中,它被用来度量系统的无序程度。但对于这个概念,一直以来人们的理解有限。

通信的基本问题是,在一点精确地或近似地复现在另一点所选取的讯息。

[插图]

香农提出的基本思想是“把信息量视为负熵”

信息就是信息,既不是物质也不是能量。

模拟的就像计算尺,数用间距来表示;而数字的则像算盘,算珠要么被计数,要么不被计数,没有介于两者之间的状态。同样,用来调节光线的变阻器是模拟的,而墙上的开关则是数字的。杰勒德认为,神经系统的化学活动和电活动都是模拟的。

香农和维纳的侧重点有所不同。维纳用熵来度量无序程度,而香农用熵度量的则是不确定性。不过,正如他们所意识到的,两者从根本上说是一回事。一个书面英语样本中的内在有序性越强(有序性表现为为语言使用者有意识或下意识所知悉的统计特征),其可预测性也就越高,换用香农的话来说,也就是后续字母所传递的信息量越少。如果受试者对下一个字母是什么信心十足,那么这个字母就是冗余的,它的出现没有贡献新的信息。信息是出人意料。

信息可被认为是从无序中夺得的有序。

他的做法是,用一个测试来代替这个问题,他称之为“模仿博弈”,也就是后来鼎鼎有名的“图灵测试”。

图灵认为,数字计算机包括三个部分:一个“信息仓库”,相当于人类计算员的记忆或纸张;一个“执行单元”,负责完成一个个操作;以及一个“控制器”,管理一个指令列表,以确保各指令按照正确顺序被执行。这些指令被编码成数,它们有时被称为一个“程序”,而构建这样一个列表的工作通常被称为“编程”。

在其中他会解释基本思想,比如调皮地引用《新约·马太福音》第5章第37节的话,“你们的话,是,就说是;不是,就说不是;若再多说,就是出于那恶者”

比如他在宾夕法尼亚大学的一次演讲中就说道:“总而言之,我认为,这一整个信息产业将在本世纪快速崛起和发展,其中包括信息的采集、信息从一点到另一点的传输,以及恐怕是最为重要的,信息的处理。”[插图][插图]克劳德·香农(1963)

然而,香农经过粗略计算后指出,一盘典型的国际象棋棋局涉及的可能组合数目超过了10120——这个数要远大于以纳秒计的宇宙年龄。因此,在香农看来,计算机不能靠蛮力搜索来下国际象棋,而是要像人下棋那样进行推理。

信息论正开始改变理论物理学和生命科学的研究轨迹,而熵正是促成了这种改变的原因之一。

热力学“定律”能被简洁地加以表达:第一定律:宇宙的能量守恒。第二定律:宇宙的熵恒增。

而在信息论中,熵度量的是一条讯息的不确定程度,即身为由信源发出的所有可能讯息中的一条的概率。这些可能讯息的出现概率不一定相等,因此,香农的公式是:H=-Σpi log pi。

信息正是讨论和度量诸如复杂度与有序度、组织性与特异性等生物学属性时所需的概念

行数十亿次的自我复制而仍然保持数据的完整可靠。

DNA不仅进行自我复制,分离开后,它还控制着另一种完全不同的物质的制造。而生成的这些极其复杂的蛋白质,是生物体的构成材料

“我给你举个例子。二十年前,如果你去问一名生物学家,蛋白质是如何合成的,他会回答,这个问题太过复杂,我不知道。如果你去问一个生物化学家,他会说,关键的问题在于从哪得到制造肽键的能量。而分子生物学家对此则会说,关键不在那,关键在于组装氨基酸序列的指令从何而来;让能量见鬼去吧,它自己会想办法的。”

母鸡不过是一只蛋用来制造另一只蛋的工具。

然而,如果转而从个体是为了将体内的各种基因延续下去的角度思考,那么许多解释便说得通了。同一物种的其他个体拥有这些基因中的大部分,而亲属拥有的相同基因就更多了。

地球上的生命史始于复制子的偶然出现。复制子是一种信息载体,它通过自我复制而生存和传播。副本必须自洽且可靠,但无需完美。相反,为了实现进化,错误倒是必不可少。

生命史是用负熵写就的,他继续写道:“真正在进化的是以各种形态和载体存在的信息。如果有那么一本指导生物进化的手册的话,我想,里面第一句大概应该是这样的,它读起来像句圣经诫命:应使你的信息更丰富。”

正如在无生命世界之上有生物圈,在生物圈之上也有个“抽象王国”。那么这个王国的居民又是什么呢?是思想。

“我不知道你会怎么想,但我本人一开始并不喜欢这样的想法:我的大脑不过类似某种粪堆,

无知是主观的,它是观察者的一种属性。而随机性,如果它真实存在的话,应当是事物本身的性质。这样的话,排除掉人为因素,我们就可以说,一个事件、一次选择、一个分布、一次博弈,或者最简单的,一个数是随机的。

当然,任何考虑用算术方法来生成随机数的人都犯下了僭越之罪。因为,正如已经被多次指出的,不存在一个随机数这样的东西——有的只是生成随机数的方法,而一种严格的算术方法显然不属于其中之一。

这恰好从一个方面表明了,即便借助了机械的帮助,人类在生成随机数方面也是能力低下。研究也证明,人类直觉在预测随机性和识别随机性上都毫无助益。无论愿意与否,人类总是偏好模式。

但香农还进一步考虑了讯息中的冗余:讯息中的模式、规律和秩序等因素使得讯息可压缩。讯息越有规律,就越可预测;越可预测,就越冗余;越冗余,含有的信息就越少。

但我们为什么说π不是随机的呢?蔡廷给出了一个明确的回答:一个数只要是可计算的,即它能够被一个可定义的计算机程序生成,那它就不是随机的。因此,可计算性是随机性的一种量度。

1920年,安德烈·柯尔莫哥洛夫进入莫斯科大学数学系就读。在随后十多年里,他做出了一系列影响深远的成果,尤其他的《概率论基础》

信息、随机性和复杂度,这三者本质上是等价的——三个威力强大的抽象,就像地下情人一般如胶似漆。

香农最先证明了,讯息中任何非随机的部分都可以被压缩。

窗台上的两盏灯笼可能毫无意义,也可能表示“英国人走海路”

信息并不是讯息价值的一个好的量度。

这就是空气,它杂乱却永恒地记录下了人类说过的每一句话。

阿兰·图灵或许是注意到这一点的第一人:像宇宙一样,计算机也最好被视为状态的组合,机器在一个瞬间的状态决定了下一瞬间的状态,因此,根据其初始状态和输入信号,机器的全部未来状态应当是可预测的。换言之,宇宙在不断地计算自己的命运。

印刷术作为一场通信革命,在从中世纪到现代社会的转型中所发挥的不可或缺的作用。

在“信息论”一词问世后,相继又出现了“信息过载”、“信息过量”、“信息焦虑”、“信息疲劳”等说法。

焦虑感取代了满足感,渴求与失落循环往复。人们刚开始一种体验,其他还会有什么的想法就又随即萌生。”这是富足的窘境,无疑也再次提醒了我们,信息不是知识,知识不是智慧。

他们由于同时生活在两种反差强烈的社会和经验之中而产生的困惑和犹豫,我们现在也感同身受。

我们不要独裁君主,我们也不要寡头政治或阶级统治,我们要一个遍及全球、拥有自我意识的智能。

但无限可能性是件好事,而非坏事。无意义的无序是我们要勇于挑战的局面,而不是我们畏葸不前的借口。

一直以来,是选择塑造了我们。选出真正的信息需要做功,而后遗忘它们也需要做功。

这座图书馆将继续存在,它就是宇宙。但对于我们来说,一切都还没有被写完,我们也还没有变成虚无的存在。

笔记

文字使得复用和“回忆”成为可能——这是全新的模式。它允许信息以全新的架构加以组织,分成诸如历史、法律、商业、数学和逻辑等。

💭 文化得到了传承

皮克林在波士顿作了下数学计算:“如果现在我们以两天或更少的时间,换句话说,以每小时十二到十六公里的时速获取到纽约的情报,就能占据可观的商业优势,那么当我们利用远距离传讯系统传递同样的信息,以每分钟六公里的速度,换句话说,只需一个小时就足以从纽约传到波士顿时,任何人都能意识到这其中包含着成比例的获利机会。”

💭 信息资源

give my love to”(请问候某人)时,他建议只发送gmlt即可。他还给出了更多的例子:

💭 可能是互联网缩写的由来

就像用移动物体所需的力来定义质量一样。不过换个角度看,质量的确可以用这种方式定义。 ●信息是熵。这是各个说法当中最奇怪也最强大的一个。熵的概念早已有之,在研究热量和能量的热力学中,它被用来度量系统的无序程度。但对于这个概念,一直以来人们的理解有限。

💭 熵

正如《爱丽丝镜中奇遇》里的红皇后所说的,我们只有全力奔跑,才能留在原地。

💭 我们只有全力奔跑才能留在原地,逆水行舟,不进则退!

随机性也许可以用秩序来定义——严格地说,是秩序的缺失。

💭 不存在绝对的随机正如不存在绝对的秩序。

在混乱中找出秩序,找出模式,这也正是科学家的工作。

💭 混乱中寻找秩序,秩序中制造混乱

香农在《通信的数学理论》一开头就直言不讳,宣称意义“与其工程学问题无关”。因此,忘记心理学,放弃主观性吧。

💭 意义具有主观性

书评

点评