全国客服:400-630-6658
历史报纸数字化解决方案

历史报纸数字化解决方案项目背景
Background of Historical Newspaper digital solution project

历史报纸是报社较为重要的一部分内容,不仅记载着一些信息和新闻,还是一个时代下的产物。通过历史报纸,我们不仅可以了解国家或地区的发展历史,也可以为未来的发展提供决策参考。但是报纸并不是一种好的长期保管的档案介质,为了让历史资料数据产生更多的价值,进行报纸数字化是必然趋势。


                                                                              蓝太平洋历史报纸数字化解决方案

蓝太平洋历史报纸数字化平台可以为报社提供历史报纸数据加工和二次标引,利用扫描设备与计算机视觉技术将纸介质的报纸扫描成数据字图像,再经过一系列的处理流程经人工审核后,形成方便应用与存储的电子资料,同时可借助于数据报发布系统进行发布,拓展历史信息分享渠道。 历史报纸数字化的流程如下:

NO.1 清点报刊。按照日期、版面清点数量,确认其完整性、可识别性、可扫描性,同一版中选用其中保存较好纸质文件。

NO.2 扫描和修图。利用大幅面扫描仪扫描纸质报刊,对扫描得到图片进行修正,去除污渍、裂纹等,同时需要检查

NO.3 OCR文字识别与校对。使用OCR技术,对报纸内容文字内容进行识别,可以多次校对以保证最终的质量。校对包括人工校对和智能化自动校对。

NO.4 版面分析和划分。将修正后的版面扫描图片按照主题文章进行区域划分和标识。

NO.5 制作版式文件。根据前面得到的结果将信息制作可检索的数字版式文件。版式文件是一种具有版权保护、加密、防止非法复制、防止屏幕拷贝、能够全面展示版面多媒体内容和样式、并且能够精确输出到打印设备的文件格式。

NO.6文章标引。将数字化文字内容进行标引,主要包括题名信息、作者信息、来源信息、关键词信息、摘要信息、引文信息、外部特征信息等。

NO.7数字数据验收。对上述步骤得到的文字、图片、版式文件等数字数据进行再检验,以确保完整性和正确性。

NO.8数据入库。将文字入全文数据库,图片入图片数据库,版式文件入版面数据库,三种数据库是相关联的,可以联合检索。

NO.9建立双平台检索系统。一般采用B/S架构,用户通过浏览器即可检索上述三种数据库。

5*8小时技术支持电话:010-62978955  
北京蓝太平洋科技股份有限公司 © 2000-2019版权所有  京ICP备05006839  京公网安备11010802016364号