写意中国·说文解“字”丨用大数据破译汉字密码 让“冷门绝学”热起来
大河网讯 大家都听说过甲骨文,但认识甲骨文吗?甲骨文有多少个?都长什么样子?甲骨文作为古文字,离普通大众距离较远,对甲骨文的活化利用是我们当前需要研究解决的一个大课题。
2019年,安阳师范学院计算机与信息工程学院教师刘永革带领团队研发的世界第一款免费甲骨文大数据平台“殷契文渊”惊艳亮相,一下拉近了甲骨文与普通大众的距离。
3000年前的文字,计算机将如何读懂?甲骨文“撞上”现代科技,如何让“冷门”不冷?如何以大众喜闻乐见的形式展示甲骨文的魅力?
深入考古现场,掌握第一手资料(资料图片)
沉睡3000年的甲骨文急需“唤醒”
“2000年,当时回到学校,两位研究甲骨文的老师力主我开展甲骨文信息化研究,而我对甲骨文的认识等同于空白。”作为出身数学专业的本科生和计算机软件硕士刚毕业的刘永革,自那一刻起,笃定了将甲骨文信息化研究作为一生奋斗的事业。
谈起自己的研究工作,刘永革开玩笑用“两头堵”来形容,他说:“一头是中国最古老的文明甲骨文,另外一头是先进的计算机技术、人工智能。”
甲骨文发现于今安阳市西北五里小屯村北面,距今3000多年,这种远古文字,也因年代久远而充满神秘和未知,破解甲骨文成了世界难题,而要破解还有一个难题摆在面前——我们没有办法把甲骨文输入到电脑。
“因为甲骨文和汉字不一样,它好多字我们不认识,所以说你用拼音输入法不行,还有一些字像一幅画一样,那么也不能用部首,也不能拆分,此前甲骨文输入法采用编码输入,记忆负担和学习成本较大。”刘永革说。
刘永革称,之前不管是写论文、讲课,还是做研究等,所有场合使用都需要用图片粘贴,研制甲骨文输入法,建立字库,让任何人使用都可以轻松输入至关重要。
“用计算机技术研究甲骨文的编码、字库、输入法、数据库建设,为甲骨文专家提供一些工具,辅助甲骨文研究,是我和团队的主要任务。”
刘永革与业界专家学者进行学术交流(资料图片)
“殷契文渊”让甲骨文瞬间“活起来”
为了学习最新的研究成果,让思想不落伍,每当有甲骨文研究专家到安阳,刘永革和团队成员一定积极请教;甲骨文学术研究会议,时间再紧也要参加……
随着了解得越来越深入,刘永革发现,我们民族最古老的文字,因为晦涩难懂和研究资料较少,与现实技术不兼容,导致研究效率低下。
如何让甲骨文的研究信息共享,让全人类资源互通,群力群策一起研究呢?刘永革决定利用自己的专业,为甲骨文的发展绘制蓝图。
于是一个汇集甲骨文信息的“殷契文渊”项目悄然启动,这个项目就是在互联网上为世界提供甲骨文的全部信息,让全世界人民了解甲骨文、认识甲骨文、研究甲骨文。2019年,由刘永革团队用8年时间精心打造的世界第一款免费甲骨文数据库 “殷契文渊”惊艳亮相。
“比如说,某个字不认识,就可以登录我们的殷契文渊,通过点击部首,与这个字相关的信息都可以查到,可以把这个字输入到文档里。”刘永革举例说。
从“殷契文渊”开放的第一天起,平台就对全世界用户提供免费服务,它里面现有152种著录,是目前最大的甲骨文数据库。“它不仅服务全球的甲骨文、考古、历史、文字方面的研究专家,还吸引了古文字爱好者、中小学语文教师、书法爱好者等使用。”
此前甲骨文资料很难查到,即使甲骨文专家也不可能拥有全部资料,“殷契文渊”项目建成后解决了这个问题。
“以老带新”做好甲骨文信息化研究接续传承(资料图片)
科技创新赋能破译甲骨“文明密码”
就在前一阵子,刘永革所在实验室和腾讯合作,共同开展人机协同助力甲骨文释读研究和传承活化,这个项目主要进行两方面工作。
“一方面是利用人工智能技术为释读甲骨文提供智能化工具,比如古文字图形检索工具。这些工具将设置在‘殷契文渊’;另一方面,利用腾讯的传播平台优势进行甲骨文的传播,比如我们正在做的微信小程序‘了不起的甲骨文’,在公众特别是中小学中传播甲骨文文化,做好研学活动,由本省发展到全国,该小程序三月底将进行内部测试。”刘永革介绍说。
为完成甲骨文大数据平台信息采集和录入工作,每年都有学生从大一开始参与甲骨文信息化课题研究。在刘永革的支持下,学院还开设了《甲骨文信息处理》特色课程。
“甲骨文研究专家、书法专家、信息技术专家……目前,我们已经组建了一支跨专业、多学科的甲骨文信息化处理团队,甲骨文信息化教学和科研都位于全国前列。”刘永革骄傲地说。
“眼下,我们和腾讯合作已经取得了三项技术突破,一是提出了一个甲骨文全信息数字模型,二是研制了光照变换矩阵的甲骨文高清拍摄技术,三是确立了甲骨三维建模的技术和设备,马上进行第一批甲骨文三维建模实验。”
“做好传承,把‘殷契文渊’建设好,使安阳真正成为世界甲骨文数据中心;大胆创新,利用人工智能技术破译甲骨文,让科技赋能研究,用计算机破解甲骨文,揭开甲骨背后‘文明密码’,讲好甲骨文的故事。”刘永革说,他要将甲骨学研究带入新的智能化时代。(臧小景)
责编:刘新
审核:徐晓敬
1、北国网所有内容的版权均属于作者或页面内声明的版权人。未经北国网的书面许可,任何其他个人或组织均不得以任何形式将北国网的各项资源转载、复制、编辑或发布使用于其他任何场合;不得把其中任何形式的资讯散发给其他方,不可把这些信息在其他的服务器或文档中作镜像复制或保存;不得修改或再使用北国网的任何资源。若有意转载本站信息资料,必需取得北国网书面授权。否则将追究其法律责任。
2、已经本网授权使用作品的,应在授权范围内使用,并注明“来源:北国网”。违反上述声明者,本网将追究其相关法律责任。
3、凡本网注明“来源:XXX(非北国网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。