为了进一步规范我馆纸质档案数字化工作,根据《纸质档案数字化规范》(DA/T 31-2017)及有关法律、规章,结合我馆工作实际,制订本办法。
一、纸质档案数字化的基本要求
(一)基本原则
纸质档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足学校师生员工乃至社会对档案利用的需求。
1.规范性原则:所有档案信息必须按照规定的技术要求、文本格式和工作标准进行数字化。
2.安全性原则:在档案信息数字化过程中要确保档案原件的安全、确保数字化档案信息的内容与档案原件相吻合、确保档案信息内容不泄密。
3.效益性原则:在充分调研的基础上制定数字化方案。优化工作流程、采用合理的技术手段和适宜的数字化加工设施。
(二)数字化对象的确定原则
1.保护至上,分步实施原则
2.需求导向,急用先上原则
(三)基本环节
纸质档案数字化的基本环节主要包括:档案借还、档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。
二、纸质档案数字化的过程管理
在进行纸质档案数字化加工过程中,要切实保证纸质档案原件的安全性和保密性,严防在数字化加工过程中发生纸质档案的损毁、丢失、泄密等现象。加强纸质档案数字化各环节的安全保密管理机制,如引进第三方公司进行数字化,纸质档案数字化前必须与公司签订保密协议,确保纸质档案和数字化档案信息的安全。
(一)档案借还
纸质档案数字化的各个环节均应进行详细的登记。建立档案交接签字确认手续,对借出或归还的档案进行数量清点,质量检查,在数字化工作完成的同时建立起完整、规范的借出或归还记录。
(二)档案整理
在扫描之前,根据档案管理情况,按下述步骤对档案进行整理,并视需要作出标识,确保档案数字化质量。
1.纸质档案核查
按照档案整理规范要求,对纸质档案信息进行核查。对错误或不规范的档号、案卷题名、文件名、责任者、页数、密级等信息,应及时进行修改并记录。严禁对涉密档案进行数字化加工。
2.拆除装订物及页面修整
应以对纸质档案的保护为原则确定是否拆除装订。如需拆除装订物,应注意保护档案不受损坏,并在拆卷前对档案页数再次清点核对。对于破损严重、无法直接进行扫描的档案,应先进行技术修复。
3.案卷装订
扫描工作完成后,拆卷后的档案应按档案整理要求进行重新装订。案卷装订以尽量恢复各类档案的原样为准,确保档案的排列顺序、案卷内文件的排序与原样的一致性。若有特殊情况,应做好相关记录。
(三)档案扫描
1.扫描方式
根据档案幅面的大小(A4、A3、A1、A0等)选择相应规格的扫描仪或专业扫描仪进行扫描。纸张状况较差的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
2.扫描色彩模式
为最大限度保留档案原件信息,便于多种方式的利用,宜全部采用彩色模式进行扫描。
3.扫描分辨率
扫描分辨率的选择,应保证扫描后的图像清晰、完整,并综合考虑数字图像后期利用方式等因素。因图片OCR识别的需要,扫描分辨率应不小于300dpi;需要进行仿真的档案及声像档案,扫描分辨率应不小于600dpi。
4.扫描登记
认真填写纸质档案数字化登记表单,登记扫描的档号及页数,核对扫描页数与纸质档案页数是否一致,不一致时应注明具体原因和处理方法。
(四)图像处理
1.图像数据质量检查
数字图像不完整或图像失真度较大时,应重新扫描。对于漏扫、重扫、多扫等情况,应及时改正。数字图像的排列顺序与档案原件不一致时,应及时进行调整。对数字图像拼接、旋转及纠偏、裁剪、去污等处理情况进行检查,发现不符合图像质量要求时,应重新进行图像处理。
2.图像数据处理
对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜(倾斜度不大于百分之一)为准。对图像页面中出现的影响图像质量的杂质,应进行去污处理。对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
(五)图像存储
1.存储格式
采用彩色模式扫描的文件,应提供2套存储格式,一套为JPEG格式,一套为转换后的PDF格式。同一批档案应采用相同的存储格式。
2.图像文件的命名
以档案档号为图像文件命名。多页文件应按页码顺序合并在一个文件夹中并以相应的档号命名。
(六)目录建库
1.数据格式选择
目录建库所选定的数据格式应能直接或间接通过XML文档进行数据交换。按照中国海洋大学档案管理系统要求进行著录,建立档案目录数据库。
2.目录数据质量检查
采用人工校对或软件自动校对的方式,对目录数据的准确性、完整性、规范性进行质量检查。
(七)数据挂接
应按照档号规则对数字图像进行挂接,以实现目录数据与数字图像的关联。
逐条对挂接结果进行检查,包括目录数据与纸质档案数字图像对应的准确性、已挂接数字图像与实际扫描数量的一致性、数字图形是否能正常打开等,发现错误及时进行纠正。
(八)数据验收
1.验收方式
以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。数据验收时抽检的比率不得低于5%。
2.验收指标
能够采用计算机自动检验的项目应采用计算机自动检验的方式进行100%检验,检验合格率应为100%。对于无法用计算机自动检验的项目,可根据情况以件或卷为单位采用抽检的方式进行人工检验。抽检比较不得低于5%。
(九)数据备份及电子文件目录存档
经验收合格的完整数据应及时进行备份,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并实行异地保存。对扫描档案的电子文件目录应及时打印并归档。