他把汉字装进了电脑!“当代毕昇”王选的三大人生快事
他是我国著名的计算机科学家,研制成功汉字信息处理与激光照排系统而被称为“当代毕昇”,让我们一起走进王选的世界。
整理/记者 李慧 图文编辑/陈永杰 图片来源/北京大学王选纪念陈列室
编者按:
汉字是中华文明的重要标志。上世纪80年代,“当代毕昇”王选发明汉字激光照排系统,引发我国印刷业继毕昇发明活字印刷术后的第二次革命,使汉字焕发出了新的生机和活力,汉字信息处理真正进入计算机时代,印刷业一跃从“铅与火”迈入“光与电”。汉字激光照排系统和“两弹一星”、杂交水稻、高铁、航母等,共同为我国成为有世界影响力的大国奠定了重要基础。
日前,北京市科协举办“传承科学家精神——讲好中国科学家故事”科学传播沙龙。北京大学王选纪念陈列室主任、王选院士生前专职秘书丛中笑,以科普方式讲解了汉字激光照排技术引发中国印刷技术革命的非凡历程,同时通过讲述王选院士一个个生动曲折的故事,带领听众走进“王选的世界”,学习其创新思维和方法,领略其高尚的精神风范,引起听众强烈共鸣。
【主讲嘉宾】
丛中笑
北京大学王选纪念陈列室主任
王选院士生前专职秘书
○ ○ ○
“它的价值和难度深深吸引了我”
四十多年前,我国的计算机还主要用于科学运算和国防尖端工程,系统里没有精密汉字。报纸、书刊主要用铅制的活字排版印刷,手工挑字、人工排版效率很低。为此,1974年8月,在周恩来总理的亲自关怀下,我国设立了748工程,即汉字信息处理系统工程。工程包含有三个子项目,王选研究的子项目就是汉字精密照排。当时王选是个在家养病的病号,十多年没有办法工作,他的夫人、北大数学系教师陈堃銶也是个病号,所以后来就有媒体报道说,两个病号做出了一件惊天动地的大事。
1975年,陈堃銶参加了北大一项有关计算机的调研,听说了748工程,回来后告知了王选,王选当时一下子就被汉字精密照排项目所吸引,开始自发研究。后来很多媒体问他为什么选择这个项目,他说,“是它的价值和难度深深吸引了我”。王选后来常建议自己的学生选择科研项目的时候,也要秉持这两点,才能解决大的问题,做出大的贡献。
当时王选每月只有40块钱劳保工资,他住在北京大学,每天坐公交去中国科技情报所查阅外文资料。从家到和平街公共汽车车票要两毛五分钱,如果提前一站下车只要两毛。于是为了节约这五分钱,他总是拖着虚弱的身体提前一站下车步行。
▲20世纪80年代,王选在位于北大旧图书馆的计算机所会议室里凝思
通过调研,他了解到日本正在流行光学机械式二代机,欧美已经发展到了阴极射线管式三代机,可以用计算机来控制了;全世界只有英国一家在做第四代也就是激光照排系统,但还没有成功。中国有五家班子在做,每个班子都实力雄厚,但是都没有做出来,因为选择的都是二代机或三代机的技术道路,而且是模拟存储的方式,就是把汉字像西文一样,刻在一个圆盘上或者有机玻璃滚筒上,再去照排。西文比较容易,因为字母不多,字体不多,字号也不多,而汉字多达数万,常用的也有六七千个,还有10余种字体、约20种字号。第一个难题就出现了,汉字不可能刻得下。
王选于是提出走数字化存储的道路,但因为汉字信息太庞大了,全世界都解决不了这项难题。所谓的数字化存储,就是把每个字的字形变成由许多小点组成的点阵,每个点对应着计算机里的一位二进位信息,没有笔画的地方记0,有笔画的地方记1。报纸常用的一个五号字大约需要划分为100×100=10000个方格组成的点阵,而排标题用的大号字则需要1000×1000以上的点阵。这样算下来,仅常用汉字的字体和字号加起来,整个信息量要达到数千兆。当时数千兆是大家无法想象的,当年北大的那台计算机内存外存加起来只有几百K,后来进口了保加利亚磁盘,也不过七兆不到。全世界是什么情况呢?美国最先进的计算机当时内存外存加起来也不过几十兆。所以大家都被这个难题所困扰,日本人形容说,这比登天还难。
因为王选在北京大学学的是计算数学,他首先想到的就是用“轮廓+参数”的数学办法来解决—对于不规则的笔画,比如点撇捺,在笔画上选取合适的点,点与点之间用折线相连,把空心的轮廓信息存到计算机里;而对于横竖折这类规则笔画,就可以用参数来表示它的长、宽和笔锋等信息。通过上述办法,将汉字信息压缩了500-1000倍,存进了计算机。从而解决了将庞大汉字信息存入计算机的问题。
日本人想过用轮廓的方法表示汉字,但没想到参数,所以很难保证字形质量,将汉字一放大就变成马赛克,一缩小就变成了黑疙瘩。而王选发明了用参数信息来控制字形变化时的质量这一高招,所以不用把所有的字号都存进去,只需要存一两种有代表性的字号,通过下达指令使汉字任意放大或缩小,而且都不变形。这一技术在1975年是世界首创,比西方早了大约10年的时间,这是王选欧洲专利的核心之一,他也是我们国家第一个获得欧洲专利的人。
第二个技术是把压缩后的信息快速而不失真地还原成字形点阵。王选经过反复研究,又是通过数学的办法,设计出了一个复原压缩信息的递推公式。1975年9月的一天,陈堃銶通过软件在计算机中模拟还原出了“人”字的第一撇,她高兴得在机房里跳了起来。
▲用王选发明的“轮廓+参数”的数字化存储技术制作的汉字字模稿
接下来是选择什么样的输出方案。当时我国报纸版面传送到外地主要有两种办法,一种是用宽幅的报纸传真机传到外地,外地接收到以后再排版印刷;另一种就是航空版,排好铅版以后,用一种较厚的纸型拍打铅字,文字就印到纸型上了,然后把纸型卷起来,通过飞机运到外地。王选发现当时我国的制造工艺和工业水平完全达不到第二代、第三代照排机的标准,他就想到了我国研制的一种报纸传真机,是否可以把它的录影灯光源改成激光?王选请教了北大物理系的老师,老师回答说可以,他就有信心了,说照排机我们可以自己造出来,只要把激光输出控制技术这一步解决了,我们就可以直接选择第四代激光照排。
所谓激光照排,就是通过控制激光照排机,在遇到有笔画的“1”时发射激光到胶片或者印刷版材上感光成字。但是,国产的照排机不像国外照排机那样可以走走停停,而是不能停顿,一旦开始扫描就要连续不断地高速运转,所以要求压缩的信息要飞快地还原成点阵,供激光扫描。王选通过软件和硬件相结合的方法,发明了原创的芯片,使得字形复原的速度最终达到了每秒710个字,这也是当时世界最快的还原汉字的速度。
以上关键技术解决了,王选就做出了跨越式的技术选择:跨过流行的二代、三代照排方案,直接研制世界上还没有成功的激光照排。
总的来说,王选发明的技术主要包括三项内容:第一个是将汉字信息大大压缩,第二个是快速、不失真地还原,第三个用激光照排输出。这三项都是王选的原创技术,属于颠覆性创新。有了这个基础,我们今天在这个领域才没有被外国人占领。
○ ○ ○
“我们中国能干成这件事儿”
王选花了大约一年时间,就设计出了技术方案。但把方案转化成一个成果乃致产品,大规模推广应用,使全中国的报纸甚至全世界80%的华文报业都在使用该套系统,足足用了18年的时间,这期间王选克服了各种困难。
一开始大家都说他是个数学骗子,特别是一些业界人士,根本不相信计算机能算出字来。王选说,“如果干一件事所有的人都说干不成,那么最好的回答就是自己动手做,因为开头人们总会对新思想提出怀疑,而只有发明者本人才会不遗余力、克服一切艰难困苦、百折不回地予以实现”。
终于在1979年7月27日,王选团队没有动用一个铅字,印出了第一张报纸样张《汉字信息处理》。很多人都觉得这可能是昙花一现,光明日报记者朱军同志却执笔写了长篇报道,刊登在1979年8月11日头版头条,通栏大标题是“汉字信息处理技术的研究和应用获重大突破”,副标题是“我国自行设计的计算机—激光汉字编辑排版系统主体工程研制成功”。这件事对王选是极大的鼓舞,也是深深的刺激。他把这张报纸放到办公室的玻璃板底下,每天上班要看一眼,压了十多年,他说绝不能辜负这篇报道,一定要让全中国都用上我们的系统。
1980年,王选和同事们又排印出第一本样书《伍豪之剑》,上报以后方毅副总理批示:“这是可喜的成就,印刷术从火与铅的时代过渡到计算机与激光的时代,建议予以支持,请邓副主席批示。”邓小平同志批了四个大字:“应加支持”。
▲1985年新华社印刷厂试验车间里,周培源(左二)、卢嘉锡(右三)、黄辛白(左一)等领导和专家认真听王选(右一)介绍华光II型系统运行情况
后来,我国激光照排先后研制出了八代系统,其中前六代是王选设计的,第七、八代是他的学生为主设计的。这期间王选一直主张要“科技顶天、市场立地”。1984年曾请专家论证要不要引进外国的系统,王选也被邀请参加,会上几乎一边倒地支持引进。王选回来的时候坐公交车,为了节约五分钱,还从动物园走了一站到白石桥倒车。回来后王选就立下了军令状:“如果1985年上半年我们的系统还不能用,国家给的经费全部退回,一分钱也不要!”1985年二型系统在新华社真正实现了实用,1987年三型系统被《经济日报》采用,在全国首家“告别了铅与火”,1989年四型系统开始大规模推广,到1993年,我国几乎所有的报社和黑白印刷厂都采用了国产激光照排系统,外国厂商全部退出了中国。
▲1999年,方正直接制版系统研制成功,王选手持用方正系统出版的《新快报》
后来,记者经常会问王选,最大的苦恼是什么。王选回答,我最大的苦恼就是当时绝大多数人都不相信我们的系统能够超过国外,不相信淘汰铅字的历史变革能由中国人独立完成,这是我一直往前走的一个非常大的动力。
○ ○ ○
“半生苦累,一生心安”
对待名利,王选是这样的看法:献身科学就没有权利再像普通人那样生活,必然会失掉常人所能享受的不少乐趣,但也会得到常人所享受不到的很多乐趣。他说,我平常有三大快事:一个难关几周想不出来怎么解决,忽然一天半夜想出绝招爬起来就写,这种愉快和享受是难以形容的;第二,看到我的成果大规模推广使用;第三,发现了年轻的帅才将才,把他扶持起来超过我。
王选经常引用《颜氏家训》中的三句话:“上士忘名,中士立名,下士窃名。”他最痛恨的就是窃名,所以总是要求自己以及学生,要做出自己的东西,不要为了立名而去窃名。大家都叫王选“当代毕昇”“汉字激光照排之父”,他本人实际上是不同意的,他说这是一个集体荣誉。
1979年,美国麻省理工学院的客座教授邀请他去美国,他问,我如果去了,做出成果来算谁的?—算美国的。我的团队能去吗?—不行。王选说:“中国是发明印刷术的文明古国,汉字是中国的文字,中国汉字印刷的现代化理应由中国人来完成”,最后他还是放弃了这一机会。他带的博士生在他研究的基础上做出了一项成果,报奖的时候,他把自己的名字写在了学生的后面。他一生获奖无数,却把大部分奖金捐了出来……
王选连续工作了18年,没有休息过一天。2000年10月4日,他被确诊为肺癌。他不抽烟,也几乎不喝酒、不喝茶,但是他年轻的时候身体就不好,这次癌症长在了支气管上,确诊当月就切掉了半个肺,另外半个肺第二年又复发了,大夫指着他的背影说活不过两年,他最终坚持了五年多的时间。
王选每天都和夫人打太极拳,练气功,但是确诊的第三天他没出去,在家写下了遗嘱。第一句话就是:“人总有一死。”他在遗嘱中写道:“这次患病,我将尽我最大努力,像当年攻克科研难关那样,顽强地与疾病斗争,争取恢复到轻度工作的水平,我还能为国家作一些力所能及的事情。”从确诊到去世的1900多天里,王选有794天在治疗和住院。在此期间,他强忍着病痛,写出了11万字的文章和讲话,参加了340余次会议与活动,有时放疗刚结束就赶到会场。
他还在遗嘱中写:我要捐献我身体所有有用的东西,做完这一切后12小时内就把我火化,不要骨灰,家属也不要陪同,也不要举行追悼仪式。他非常唯物,面对死亡非常坦然和释然。另外他在遗嘱中对妻子有一个评价:“我最幸运的是与陈堃銶的结合,没有她就没有激光照排。”
陈堃銶是激光照排软件系统的总设计者,王选负责总体设计和硬件设计,所以他俩是“软硬件结合”的一个典范。陈堃銶其实1981年就得了直肠癌,不得不做了直肠切除和人造肛瘘手术,从那时候起她就腹部挂着袋子一直到现在。但夫妻俩看不出是两个病号,都是笑对人生。由于身体不好,科研又太忙,夫妻俩也没有子女。
王选走的时候是消化道大出血,他用的化疗药有一个副作用,就是消化道出血。从晚上到第二天上午,所有的止血手段都不管用。弥留之际,他的遗愿都不可能实现,捐献角膜在短时间内也找不到合适的受体;要求不举行追悼仪式,胡锦涛总书记去看望说,还是要对全国人民有一个交代。
所以夫人就跟王选商量说,咱们不输血了,现在血源这么紧张,还是留给更需要的人吧。王选当时还有意识,他眨了眨眼睛,点了点头。当时所有在场的人都哭了,认为这样太残忍了,坚持要把已从血库里领出来的血浆给王选输完……王选在生命的最后,想到的还是别人。
王选有一个大家都熟悉的好人观,他认为,“一个科学家首先应该是一个好人,凡事考虑别人和考虑自己一样多,能做到这一点的就是好人”。所以他在生命最后时刻仍然践行了自己的好人观。夫人陈堃銶在纪录片中回忆说,有一首歌叫《好人一生平安》,不见得。好人一生可能有这样那样的磨难,但他一定是心安的,因为他没有做过对不起别人、对不起国家的事。所以陈堃銶就给王选写了一副挽联:“半生苦累,一生心安”。这八个字可以说是王选一生的写照。