冷玉龙坐不住了,站起身来:“走,我们去一趟部里,找组长汇报这个新形势新情况。”
“别别别……”周至赶紧拉住冷玉龙:“还是先请两位师兄帮我们介绍一下《中华字海》的编纂思路和体例,还有就是我们要先取师兄们的卡表来试试,看是不是真的适合我们现有的扫描识别程序才行。”
“也是。”冷玉龙不禁赧然:“有点失态了,主要是听到小师弟这个玩法,有点激动啊。”
“你老师兄性格就是这样。”辜开来笑着和周至介绍:“当年师伯才给他取字冷泉,加上他的姓,就叫冷冷泉,希望他能比别人多一层冷静。”
“原来是这样。”周至觉得前辈们的故事有点好玩。
“结果脾气还是老脾气。”辜开来就笑话师弟。
“还是说正事儿吧。”韦一心笑道:“刚刚小师弟说的,中日韩大区的概念,我们在《中华字海》里边,其实也在采用。”
“是吗?”周至感到很惊喜:“我就觉得小九万字的辞书,不可能这么简单!”
冷玉泉笑道:“《中华字海》主要由两部分构成:一部分收自现存汉语辞书,如《说文解字》、《玉篇》、《广韵》、《集韵》、《康熙字典》、《汉语大字典》等书中的全部汉字;”
“另一部分,则是历代工具书失收,而应该收录的字。”
“其中有佛经难字、道藏难字、敦煌俗字、宋元明清俗字、方言字、科技新造字,以及当今还在人名和地名用字。”韦一心补充道:“此外,流行台岛、港岛、蒲岛地区的俗字,方言字以及在岛国、高丽、新岛等国通行的汉字,书中也予以收录。”
周至越听越是激动,这玩意儿要是能用的话,瀚文字库都可以直接三期完工了呀!
“那编纂的体例呢?”这回轮到他有些坐不住了。
编纂的体例很重要,如果编制方法和瀚文字库采用的方法区别太大,逻辑上无法实现转码的话,那就只有字卡可以用。
可要是两者是互通的话,字卡的编排逻辑和字库码位的编排逻辑接近,在转码入库这个环节,就可以减少很大的工作量。
“编写体例嘛,《中华字海》收字还是按传统的部首分部排列,同部首字按笔画多少排列,同笔画字按笔顺排列;”
“部首的设立,以《康熙字典》二百一十四部为基础,并酌情删并分离,最终共二百一十部。你们的瀚文字库呢?”
“我们的也是按照《康熙字典》二百一十四部为基础,不过还吸收了王码的字根编制方法,最终一共是二百七十六个字根,其中二百五十九个是王码已经存在的,剩下十七个,是我们在其他非基础汉字里找到的。”
“漂亮!”韦一心表示赞赏:“部首和字根,也符合汉字的构字法,比如福气的福字,甲骨文里就是三个部分构成,首先是最后演化为示字旁的部分,那是祭坛的意思,然后是右边部分,那是一件鬲,禾之类的礼器。底下还有两只手,整个字就是两手拿着礼器摆上祭坛的会意,希望得到祖先赐福的意思。”
“对,回归到汉字的本源,笔画就好像原子,字根就好像分子,最后组织起来的汉语大体系,就是机体了。”冷玉龙说道:“这是非常科学的归纳法,比传统的偏旁加笔画要更先进。”
“但是这个方法不够简明。”周至说道:“因此作为日常所用的辞书,还是按照偏旁笔画更加方便。”