1)第1379章 思维体系_重生之乘风而起
字体:      护眼 关灯
上一章 目录 下一章
  第1379章思维体系

  “本来是这样的。”周至乐得眼睛都眯缝了:“可是两位师兄提供的字卡太好用了。”

  “《字海》的字卡,有编号,有大字,有拼音、民国拼音、甚至还有老四角号码,还有小字的释义和凡例,满足了我们自动识别软件对于调试校准模型的一切要求,我们当然也要用到那头去!”

  周至又道:“有了字卡的辅助,我们很快便将软件识别图形文字的准确率,从百分之九十二,也就是一百个字错八个,提升到了百分之九十九点六,也就是依靠软件识别文字,一千个字里只会读错四个。直接提升了一個量级。”

  “这个成就,也直接帮我们跨过了数字图书馆最后一个巨大门槛,这个软件,已经算是真正成熟了。”

  “这次带来的数字化的《字海》,就是我们第一本通过计算机扫描识别技术建立起来数字图书,既然字数最多的《字海》都可以实现数字化,那对其余典籍,我们当然充满了信心!”

  “那就是古籍数字化工作可以提上日程了?”韦一心大喜:“我们学校正在搞《四库全书丛目》这部大书,要不肘子你来我们学校?学籍什么的好说……”

  一边计算机中心主任也连连点头:“其实清华那边没去头,肘子你到底是文科生,来我们这儿正好搞古籍数字化工程,想想看,这个大工程搞出来,那会是多大成就?古人说的君子三立,立德立功立言,不都在里边了?”

  直到周至穿越回来之前,国家将典籍进行数字化的工作,主要还停留在建立树状数据库的较为原始的应用阶段。

  这样做的好处就是简单明了,升级维护也容易,信息保存也算全面,一句话说完,就是够用,但不好用。

  硬件上,要克服现有计算设备算力不足的情况,就利用网络时代的助力,将广域网上的所有算力资源都最大程度地利用起来,研发出基于互联网基础的分布式算力应用系统。

  不过这事儿暂时没有可能,周至只好笑着解释:“我们蜀大的《道藏》,《儒藏》两部大书也准备开修了,师爷爷是不可能放人的。”

  这样的东西在周至眼里当然是不合格的,最多最多只能算是地基,离百尺高塔还差着老远的功夫。

  就好比一个标准的图书馆,将一本书作为一个文本文件整体存放,然后给这个文件编出,书名,书号,最多再给出个作者,出版社之类的信息,作为标签。

  那第三个如何就来了:我们如何开发这个标签采集软件和球网状的数据拓扑关联系统。

  周至听得心中暗笑,应该说北大的文化氛围的确可以的,你看计算机中心主任都说得出君子三立这样的命题解读来……

  比如典籍数字化工程,按照一般的思路,好不好用?

  答案肯定:不

  请收藏:https://m.bqg54.com

(温馨提示:请关闭畅读或阅读模式,否则内容无法正常显示)

上一章 目录 下一章