加入收藏 | 设为首页 | 会员中心 | 我要投稿 | RSS

您的位置:首页 > 社会 > 文化事业 > 文化服务 文化服务

扫码关注

严控书目和读者数据质量奠定互通基础

作者:张岩 来源:深圳经验——“图书馆之城”创新发展二十年 责任编辑:xiangwang 2024-07-11 人已围观

2012年“图书馆之城”建成之初,虽然数据通过合库已经实现中心化,分布式的系统架构也被证明有能力支撑全城统一服务,但仍然在数据、服务、技术等各个方面暴露出众多未能融合的问题,特别是文献采编仍沿用各自原有系统。深圳图书馆经过全面的梳理和研究,决定首先采用已有数据标准先行探索数据融合,启动高质量融合建设进程,再以数据融合为驱动逐步启动各馆差异化的服务与技术融合。
 
ULAS在合库过程中仅将各馆多年积累的MARC数据存贮到了一个数据库中,书目数据中热门、经典文献的重复率极高,全城统一书目检索系统亟需优化。2015年启动的中文图书联合编目暨书目质量控制工作,通过采用ULAS联合编目,堵源头、清数据的方式对重复数据、问题数据围追堵截。2017年,各区馆均已加入中文图书联合采编。截至2020年底的四年多时间内,深圳图书馆共完成52万条中文图书重复数据的清理、合并工作,并逐步拓展至报刊及外文文献。书目数据质量控制工作不仅仅提升了书目检索系统的查准率,更为后期建立书目维度的数据模型奠定了基础,让基于书目的大数据分析成为可能。
 
2018年,为规范“图书馆之城”合库后的读者数据,深圳图书馆处理10万余条各馆旧证数据以及涉及8000多个身份证号的重复的1.8万个读者证数据,并发送8568条短信通知读者,实现“一人一证”。同时清理出生日期、手机号码等信息明显错误的读者数据,利用身份证号补齐出生日期数据,增加手机验证码校验手机号码有效性等技术手段完善ULAS读者数据质量控制机制,其中规范的出生日期数据为基于年龄的统计分析奠定了数据基础。读者数据的清理和质量控制不仅仅是凭身份证办理自助借还业务的基础,也是ULAS升级为支持身份证号登录、建立读者信用分体系的前提,更是之后通过统一技术平台走向服务互通、业务互通、多门户平台互认的关键。
 

很赞哦! ( )

评论

0

搜一搜