获取更多信息请下载APP

大数据能否破解甲骨文“密码”?

来源:    发布日期:2017-08-30 13:32:10   阅读量:0

文/记者 李晶 编辑 刘昭 

“一字十万元”悬赏破解甲骨文的新闻最近见诸报端,其实这是去年启动的一项计划,因并未在社会上引发太大关注,近期启动了第二波的宣传工作。

2016年10月28日,全国哲学社会科学规划办公室委托中国文字博物馆在《光明日报》刊发了《关于征集评选甲骨文释读优秀成果的奖励公告》,公告称“对破译未释读甲骨文并经专家委员会鉴定通过的研究成果,单字奖励10万元;对存在争议甲骨文作出新的释读并经专家委员会鉴定通过的研究成果,单字奖励5万元”。

“一个字十万元”的奖励最初仅在甲骨文研究圈内掀起波澜,并未引起广泛的社会关注。中国文字博物馆工作人员在电话中告知北京科技报记者,为吸引更多关注,近期已开展第二波的宣传工作。该工作人员还称,现已收到一些释读作品,但具体数量和作品质量不便透露,下一阶段的宣传工作中可能有所体现。

“悬赏”公告揭开甲骨文神秘面纱

“一字十万的悬赏公告刚一发出,我的微信朋友圈就被刷屏了”,首都师范大学甲骨文研究中心王子杨副教授回忆说。同行、同事纷纷开涮说,“这下你可发财了”“买房的首付有着落了”,连久未谋面的同学也打电话来提醒着“苟富贵,勿相忘”,大张旗鼓的架势,让人不禁压力山大。“说啥好呢?你们真以为释读一个甲骨文字跟拔萝卜这么容易吗!”

甲骨文从发现到研究已经有一个多世纪了,这些商周时代刻在龟骨上的文字, 又叫“契文”“卜辞”“龟骨文字”“殷墟文字”等,是我国目前最早的成熟的文字体系,也是研究商周社会历史重要的资料。

上世纪对甲骨文的考释(考证并解释)曾有一段相当值得追忆的时代。甲骨学研究也出现了罗振玉、王国维、董作宾、郭沫若四大泰斗,并称为“甲骨四堂”。老一代甲骨学者的精深耕耘以及后来学者的递相研究,使得甲骨文的释读超过1000字,而时至今日能被释读的甲骨文仍没有超过2000字,大约只有已发现甲骨文字的三分之一。

“其中的一些甲骨文字,可能是 ‘死文字’。”主攻商周考古和古文字学的中国社会科学院考古研究所严志斌研究员解释说,这些甲骨文没有留下“后代”,所以考释不出来;还有一些甲骨文属于专门性的文字,如古时的地名、族名、人物名,或者其它专属称名,在缺乏相关对比史料的前提下,释读难度很大。

“一个字,十万元”这是中国文字博物馆对甲骨文优秀释读作品给予的“悬赏”奖励,从侧面也佐证了“释读”的难度。既然如此之难,有没有哪一种现代科学技术可以“化难为简”呢?中国文字博物馆的公告中就提到了两个:云计算、大数据,还表示欢迎使用这些新的技术来释读甲骨文。

▲河南安阳,中国文字博物馆广场两 侧碑廊内的甲骨文

大数据释读甲骨文,难!

云计算也好,大数据也罢,其运用基础是先建立一个庞大的数据库。

数年前,严志斌在完成博士论文时就对古文字字形进行过数字化处理,通过造字程序造出字符,使其能够被电脑识别。在他看来,这项繁复耗时的工作,对基础性研究是不可缺少的。

实际上,目前甲骨文的研究中已经离不开数据库的参与。“机器记忆总要比人脑记忆更好,而且可以随时调用出来,”王子杨表示,现在很多研究者都在自建数据,能够查找一些词例。

自建数据库难免有所局限,古文字学研究者也寻求其他数据库的资料。他们提到较多的是香港中文大学的“汉达文库”,目前收录8种书可供查阅。不难发现,现有甲骨文数据库集中于高校、科研机构内,鲜有企业参与和国家层面投入。在自己建库,又互不开放的情况下,数据库对促进甲骨文研究的作用可谓杯水车薪。

与此同时,数据化的甲骨文往往用于缀合甲骨、对对字形,在受访的几位古文字学者来看,让数据库“释读”甲骨文,可能性并不大。

所谓“释读”,不仅是判断字形——认字,还要加以解释。只有具备合理逻辑和史料支撑,才会被业内认可。然而,这种认可并不意味着某个或某几个甲骨文字被确定了,其他研究者仍可以变换角度提出新“释读”。

“这个过程就像爬山,走不同的路都可以到达同一座山顶,”严志斌如是说。对字形结构的分析没有异议,原文字环境中读着文通字顺后,大家会逐渐认可这种“释读”。这个检验的过程,可能是5年,也可能是几十年。而这也并不代表100%释对了这个“甲骨文”。

王子杨进一步解释,“‘形音义’三者都满足,才算是一个完全释读。”甲骨文中有相当数量的字用法较清楚,如地名(或国族名、人名),甚至可通过辞例结合现有认识确定其大致释读方向,但无法辨认这个甲骨文字的形体;或者可辨析形体,但没有后世的字与之对应,这些字就只能属于“未释字”。另外,古文字学者从出土的文字材料中找到了与之可以系联的形体,但缺少若干演进的环节,没有确凿证据证明两者是一个字的早晚不同写法,这样的甲骨文字也属于“未释字”的范畴。

王子杨直言,“甲骨数据库,可以把同一个字的不同辞例聚合在一起,但字形分析、语义靠大数据是没法解决的”。

▲字形演变过程(图片来自网络)

考古学家是极少数难以被AI替代的安全工作之一

从AlphaGo打败人类最优秀的围棋选手开始,人工智能已经开始挑战多个领域的人类工作,比如,工业生产制造、驾驶、新闻等。难道它没有可能做出一些完美的甲骨文“释读”吗?

遗憾的是,很难想象会有企业或政府愿意投入足够的资本,将考古学推向自动化。2013年牛津大学的卡尔·弗瑞及迈克尔·奥斯本发表了《就业的未来》研究报告,因被计算机取代的可能性只有0.7%,考古学家被列为未来极少数的“安全”工作。

古文字的考释是考古学分支之一,也属于被新技术“入侵”很少的学科。“古文字学研究没什么利润,没有企业愿意投入,”严志斌也感慨,“AlphaGo能打败人类围棋手,但至少目前人工智能等新技术在古文字学研究中作用并不大。”

实际上,目前的古文字学研究仍然采用传统方式,要求研究者通识古文字、古汉语、古文献,想要有所贡献至少要有几十年的坚实积累。

考古学家的思维也固化成了“老古董”,不愿接触新技术吗?并非如此。上世纪70年代中期,四川大学童恩正先生就曾考虑过通过计算机进行甲骨缀合,也就是尝试把散落的甲片拼合在一起。但多年以后,古文字学家仍通过甲骨形态特征、同文例等手段进行缀合。因为后者的效率会更好。

“甲骨文字的释读,不是猜字谜,更不是看图说话。古文字学者要从意义入手,比对后代字形的演变,然后用甲骨文字的演变规律去解释文字。这是一个严谨、完整的程序。”王子杨还表示,“释读”能取得突破,还需要有“新材料”加入。新材料包括新的甲骨、青铜器上的金文材料、战国时期的简帛等出土的古文字材料。中国文字是唯一的不断发展却仍在使用的文字,因为其发展规律有迹可循,而古文字学者掌握了其中的演变规律,从这些后代文字资料就可以上溯到甲骨文。

▲甲骨缀合并不是件轻松的事。图为山东大学考古系方 辉教授仔细地粘接修复卜甲

“悬赏”对甲骨文释读的效益

“释读一个字奖十万元”的“悬赏”公告,让听起来高深莫测的甲骨文释读,成为“接地气儿”的事。而这种方式,在考古学领域的专家看来,也是不同寻常的。

王子杨判断,这是落实习总书记在哲学社会科学工作座谈会上的重要讲话精神的举措。习总书记明确指出,“要重视发展具有重要文化价值和传承意义的‘绝学’、冷门学科。这些学科看上去同现实距离较远,但养兵千日、用兵一时,需要时也要拿得出来、用得上。还有一些学科事关文化传承的问题,如甲骨文等古文字研究等,要重视这些学科,确保有人做、有传承。”

2016年10月28日,“一个字十万元”的奖励公告发出,2017年2月16日,河南省委宣传部副部长李宏伟曾对外表示,河南安阳的中国文字博物馆已收到8篇论文。并称,“河南在贯彻落实习近平总书记重要讲话精神,传承甲骨文研究方面,已经迈出了坚实的一步”。

北京科技报记者接触了几位考古学领域专家,他们都认为对甲骨文释读研究而言,中国文字博物馆采用的方式可能有一定促进作用,最终也将有人领取这份奖励。

严志斌认为,人文学科的研究是难以量化的,古文字学的释读更是需要实践检验的。民主集中制原则是否适合于人文科学研究规律,还是需要谨慎运用的。

王子杨则指出,政策时效性举措对甲骨文研究可能有推动作用,对甲骨文研究更深层的人才断档问题却推动力不足。国家对社科类研究出台长期的倾斜政策,才是真正“社科的春天”,才能缓解甲骨文研究人才不足,对古文字研究的意义也将更为长远。■

▲我国甲骨文研究现状