91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

美国健康科学图书馆数据服务实践的启示

  2021-12-02    112  上传者:管理员

摘要:开放科学正逐渐改变传统科研范式。文章采用文献调研法,在分析美国健康科学图书馆数据管理服务现状的基础上,选取纽约大学健康科学图书馆数据服务的实践案例深入分析并进行总结得出启示,主要包括:找准机遇,嵌入健康医学科研项目工作流;分工协作,积极推进多部门分管服务;完善馆员培训机制,促进数据服务可持续发展;设立数据馆员岗位,不断深入数据管理服务等。

  • 关键词:
  • 健康科学图书馆
  • 开放科学
  • 数据管理
  • 数据驱动
  • 科研环境
  • 加入收藏

随着数据密集型科研范式的到来,海量数据的传播与共享催生全新的科研环境,数据成为科学研究与发现的基础和主体,以数据驱动的方式进行知识探索与发现的科学研究应运而生。

生物医学大数据涉及广泛,而且对人类医学事业的发展和进步至关重要。医学科研人员对医学科研及临床大数据的获取和利用面临着重大的挑战。图书馆作为信息获取、知识组织、情报服务的主要机构,应顺应网络环境的发展勇于承担起科研数据管理服务的重任,扮演好科研工作“最佳伴侣”的角色,最大限度地满足临床及医学科研人员的数据需求。


1、美国健康科学图书馆数据管理服务现状


国外的科学数据共享始于20世纪70年代[1],并且科学数据素养问题引起了图书馆业界的高度关注,进而带动了高校图书馆对数据素养教育的不断探索。健康医学领域是科研数据管理和共享起源较早的领域,由于其科研数据的独特性和代表性及其对医学科研人员、医学工作者的科研和实践价值,也是备受关注的学科领域。目前,部分健康医学图书馆纷纷开展了科研数据管理服务并已形成相当成熟的服务体系,以满足科研一线的医学科研人员以及临床医学科研数据管理的需求。

在美国,国家层面对于科研数据管理提出了较高的要求和规范。美国国立卫生研究院NIH规定2003年10月1日起,所有向其申请项目经费超过50万美元的需提交数据管理计划[2]。2010年,美国国家科学基金会(NSF)发布了所有项目必须提交“数据管理计划”的规定[3]。此外,美国医疗保健研究与质量局、美国疾病控制与预防中心等健康医疗机构也发布了数据共享政策[4]。

学术期刊及出版集团是科研数据传播交流的媒介之一,目前,Science[5],PNAS[6],Nature[7],BMC[8],Willy[9],PLoSOne[10]等诸多国外学术出版社及期刊纷纷对科研数据的存储以及传播提出明确政策。此外,国际医学期刊编辑委员会(ICMJE)认为,由于临床试验参与者处于研究风险之中,有伦理义务来负责任地共享干预性临床试验产生的原始数据。2016年1月,ICMJE发表了一项关于临床试验数据共享的提案,旨在帮助创造共享去标识个体患者数据的常态化环境[11]。

德国马普学会等机构正式发起了“OA2020”国际行动计划[12],旨在加速现有学术期刊从订阅模式向开放获取模式转化。作为图书馆界的期刊,JMLA的主编在2017年5月任命了一个工作组,审查现有的期刊数据共享政策、与现有研究数据政策标准化和实施建议保持一致的前提下负责为期刊制定数据共享政策[13]。

除此之外,包括纽约大学、华盛顿大学等部分美国高校健康医学图书馆专门设立了数据馆员等工作岗位,并纷纷成立数据服务团队,面向本校师生以及附属医疗机构开展数据支持服务。纽约大学健康科学图书馆数据服务部门与技术部门的Redcap管理员和临床数据管理支持部门主管以及专业教师合作建立伙伴关系,通过图书馆现有的数据系列讲座“日常数据”提供培训课程,面向师生以及附属医疗机构临床及科研人员开展包括Redcap、I2B2工具(该工具旨在帮助整合和协调来自医疗保健和研究的异构数据)的初级课程以及高级课程的培训,共同为用户提供数据支持服务[14]。

尤其是华盛顿大学健康科学图书馆联合多个部门组建转化研究和信息实验室(TRAIL),共同推进高校协同合作开展临床研究数据管理[15]。马萨诸塞大学医学院LamarSoutter图书馆联合大学图书馆共同开发数据管理协作课程,以此挖掘和提高科研师生的数据管理能力[16]。另外,印第安纳大学图书馆[17]开展了针对生命科学数据的数据管理服务。加州洛杉矶大学LouiseDarling生物医学图书馆、印第安纳大学Lilly医学图书馆、罗切斯特大学EG矿工图书馆、约翰霍普金斯大学Welch医学图书馆等美国健康科学图书馆馆员都以“学科馆员”的身份参与相关课题的研究中,通过提供数据管理服务,协助临床科研人员完成科研项目[18]。

开展数据管理相关服务的同时,美国健康科学图书馆从事数据管理服务的馆员也积极开展了对数据管理服务的探索和思考。中国台湾卫生研究院图书馆服务部馆员、信息专家LisaM.Federer对大数据时代的研究数据管理过程中图书馆员的角色转变和工作机遇[19]、生物医学研究人员的数据素养培训需求[20]、临床和科研人员对生物医学数据共享和再利用的态度等展开了研究[21];马萨诸塞大学医学院图书馆员开展了关于使用Tableau为交互式科学和生物医学可视化提供图书馆支持研究[22];美国大学图书馆通过对图书馆网站内容的调研和分析开展研究数据管理服务[23];明尼苏达大学健康科学图书馆开展了在学术环境中对公共卫生研究人员的信息科学需求的定性分析[24];斯坦福大学医学院图书馆对临床试验参与者对数据共享风险和益处的看法进行了调查和研究等[25]。


2、美国健康科学图书馆数据服务实践研究


以美国为代表的欧美发达国家高校图书馆数据管理服务一直走在世界的前列,其健康科学图书馆也不例外,优秀的实践案例为其他国家图书馆的服务提供了借鉴。本文将通过调研,选取纽约大学健康科学图书馆嵌入式数据支持的实践案例进行深入分析,期望给国内医学高校图书馆数据服务与探索带来灵感和借鉴。

2.1 纽约大学健康科学图书馆简介

纽约大学健康科学图书馆(以下简称“NYUHSL”)于2011年开始提供数据服务,其服务形式丰富多样,包括健康医学数据发现、知识组织、数据存储与分析、数据发表相关服务等。嵌入式数据支持服务是指图书馆数据服务馆员参与具体的临床以及学术研究,并发挥重要作用,为课题研究提供相关技术支持以及数据管理服务。

2.2 参与背景

研究数据管理已成为图书馆员的一项重要服务。近年来,医学图书馆员纷纷开展各项研究数据管理服务,包括提供指导、为实验室研究提供支持、围绕数据建立机构合作伙伴关系以及实施数据可视化服务等。在美国,医学图书馆员可以通过国家医学图书馆(NLM)信息专家计划获得参与研究数据管理课题的相关工作。信息专家计划于2010年成立,目的是支持信息专业人员融入生物医学研究团队,以发展研究数据管理技能。服务内容包括支持研究数据管理培训、数据库建设和研究工作流程开发与优化等[26]。

2.3 角色定位

NYUHSL2014年获得了国家医学图书馆(NLM)的信息工程项目补充项目——多元文化痴呆筛查研究,旨在改善美国国立卫生研究院(NIH)资助研究项目(R01)多元文化痴呆筛查研究的数据收集、管理和工作流程[14]。数据馆员在该项目中的作用是满足研究团队在改进数据收集和处理工作流程方面表达的需求,以提高研究效率和确保数据质量。

2.4 服务内容

NYUHSL数据馆员参与的此项项目中,主要通过标准化和重命名变量,使用Redcap创建电子数据采集系统以及开发记录完备、可重用的数据处理工作流程来解决数据收集、输入和校正问题。数据馆员参与该项目的重点是改进3个方面的问题:数据文档、数据收集、数据处理工作流程。通过引入电子数据采集(EDC)系统Redcap实现了以电子录入方式取代纸质表格输入数据,实现研究效率和数据质量的实质性改进。EDC系统中构建表单内容涉及输入变量名称、类型(例如自由文本/多项选择)以及适用的特定值(例如男/女/其他)等。为了高效、准确地构建EDC系统,图书馆员开展的第一项任务是转换变量名称和创建数据字典。

在数据馆员参与此项课题之前,来自R01资助的研究和主要研究者(PI)进行的另外两项研究的数据被合并,表格上的变量大量增加。此外,在3项研究中由于重复收集,表单中的数据变量命名标准不一,且未在数据字典中有所记录。数据分析员将这些表格中的数据输入SPSS统计软件,将3个数据集合并为1个分析数据集的过程中增加了出错的风险,并且不易被共享和重用。图书馆员介入并且力图规范录入数据形式、大量不明变量以及数据集工作流程,以改善研究团队的整体流程。

2.5 数据文档

该临床研究小组使用的变量名称并不完全规范,部分变量使用了首字母缩写和数字形式代替,这种命名方式使得研究中收集的数据意义不明确,同时也增加了数据分析中出错的可能性。除此之外,变量的文档范围不够完整,尤其是缺乏数据字典而加剧了这个问题。没有完整的字典,数据就不利于共享与重用。此外,由于缺少数据字典以及不规范的变量名称,不同的研究人员可能会主观地、片面地解释数据。

图书馆员开展的第一项任务是识别复合变量并将其转换为自变量。虽然将所有复合变量转换为自变量后,变量总数有所增加,但是规范了数据标准也减少了出错的可能性。此外,图书馆员试图将变量名称转换为遵循既定数据标准的命名形式。标准提供了既定的框架,包括命名标准,用于提高所有类型研究中数据收集的一致性。因为数据是以标准化方式构建的,使得使用相同标准的研究人员更容易理解并增加了重用的可能。在这项研究中,图书馆员选择使用临床数据交换标准联盟的临床数据采集和协调标准(CDASH)修改研究的变量命名约定。当CDASH不能解决问题时,图书馆员采用国家神经疾病和中风研究所(NINDS)的通用数据元素(CDE)[27],这是主要研究者(PI)比较常见和使用的数据收集标准。

而通过CDASH或NINDSCDE未能解决的变量名,图书馆员在与数据分析师协商后制定了相关的命名标准进行命名,并将原先的变量名称转换为更具描述性的名称,因此更易于理解。变量名称转换过程完成后,图书馆员为数据字典构建了基础架构,并为研究团队提供了开发数据字典的结构以及记录转换后的变量集。数据字典的结构主要包括:变量名称、变量的属性、变量的计算方式、限定条件以及变量是否包括受保护的健康信息等。

2.6 数据采集

在此课题开展之前,课题主要研究者(PI)还参与了来自R01资助的研究以及另外两项研究,负责收集关于研究参与者的多元文化痴呆筛查的相关数据。其中一项研究是使用单一形式进行数据收集的横向研究,而其他两项研究是纵向的。不同的研究管理员分别使用纸质表格在各个站点收集数据多达900多个,最终研究小组的数据分析员再通过手动汇总,不但增加了出错的可能性,同时也降低了工作效率。

为了提高数据质量和研究效率,图书馆员建议在RedcapEDC系统中分类重建变量。Redcap是一种广泛使用、易于学习的工具,支持电子数据收集。它得到了学术医疗中心的支持,并提供了许多满足研究团队需求的新功能,尤其是其数据验证功能有助于减少或者杜绝数据输入产生的错误。对于统计分析,存储在Redcap中的数据可以以各种统计软件格式导出使用。此外,Redcap符合医疗保险可携性和责任法案(HIPAA),且允许对每个受保护的健康信息变量进行标记。Redcap的另一个功能是批量上传表单元素。Redcap允许在线设计或通过批量上传格式化的电子表格(CSV格式)创建表单,此项功能为图书馆员的工作节省了大量时间。

2.7 数据处理工作流程

图书馆员开展的最后一项工作是创建数据集分析的工作流程。原始数据由3个独立的数据集组成,每个数据集均来自不同的课题研究。具体的研究过程中,从原始数据集中手动提取主题变量的过程容易产生偏差,直接影响分析结果的科学性。图书馆员与数据分析师合作,规范了用于构建分析数据集的工作流程。一旦描述了工作流程,其中一位具有广泛编码背景的馆员作者为数据分析师提供了伪代码来执行该过程。伪代码全面描述了可重复构建分析数据集所需的逻辑。

Redcap数据库和新工作流程的引入创建了从数据收集到数据分析的简化和可重现的路径。所有数据(包括数据字典)都安全地存储在Redcap中,分析人员可以在必要时导出数据集以供使用。伪代码由数据分析师实现后,可以在原始数据集上运行以创建新的数据集,而不是继续使用手动过程添加到现有分析数据集。


3、启示


大数据时代、开放科学环境下,数据管理已成为高校图书馆的一项重要服务。通过对美国健康科学图书馆数据服务实践的调研可以看出,美国作为较早进行科学数据共享的国家,在数据管理领域已经形成相对成熟的理论以及实践成果,在分析和借鉴优秀实践的同时,给予国内高等医科院校图书馆以下几点启示。

3.1 找准机遇,嵌入健康医学科研项目工作流

嵌入科研工作流是图书馆数据服务的深化。医学高校图书馆的数据馆员应当“融入一线,嵌入流程”,跟踪科研工作的每个阶段并提供相应的数据服务。实践证明,NYUHSL积极争取国家医学图书馆(NLM)的信息工程项目补充项目的资助,发挥自身的优势,通过改进项目组数据收集和处理工作流程,融入生物医学研究团队,以提高其研究效率和数据质量。一方面,NYUHSL充分关注业内发展形势,积极抓住机遇,为数据管理提供依托,有利于提高馆员服务能力,实现自身价值;另一方面,嵌入式数据服务切实为临床以及医学科研工作提供了数据支持。

3.2 完善馆员培训机制,促进数据服务可持续发展

图书馆员作为信息、数据传递的直接主导者,在高校对学生进行数据素养教育中担负着重要的角色,图书馆员自身的数据素养直接影响服务的最终效果。国外实践证明,NYUHSL嵌入式数据支持服务之所以能够顺利开展并取得良好成效,馆员自身的数据素养是至关重要的。树立以人为本的思想观念,把人的发展放在第一位,建立科学完善的馆员培训机制,实现馆员知识结构的不断优化是图书馆数据服务可持续发展的重要保障。作为图书馆工作者,丰富的专业知识、娴熟的服务技巧以及跨专业的学科知识是胜任本职工作的基础,有计划、有步骤地对人员进行业务知识和业务技能培训是数据服务得以持续、稳步推进的重要保障。图书馆只有根据自身实际,明确培训目标;制定科学的培训内容,开展多元培训模式。同时,注重人文精神培养,不断完善培训机制,才能有效地促进数据服务可持续发展。

3.3 设立数据馆员岗位,不断深入数据管理服务

图书馆是数据管理服务的主导者。目前,大多数国外高校(普林斯顿大学、密歇根大学、纽约大学等)图书馆已经独立设置了数据馆员岗位,并且通过引进数据管理专业人才,科学界定数据管理工作岗位职责和工作内容[28]。同时,随着图书馆数据管理与服务工作的不断深入推进,数据馆员应当在积极开展服务的同时,提升自身专业水平、沟通能力以及团队合作意识,实现数据馆员素质的全面提升。另外,图书馆科研从馆员的源头抓起,建立完善的数据馆员招聘、培养与考核制度[29]。提升馆员专业素养的同时,深入推进数据管理服务,提升图书馆的社会地位以及学术影响力。


4、结语


开放科学本着“自由、开放、合作、共享”的理念,促使科研交流、传播以及合作的方式发生着巨大的变化。并且,随着数据密集型科研环境的转变,数据管理的重要性日益凸显。国内健康医学图书馆应在综合考量自身实际情况的基础上,积极学习国外图书馆服务的成功经验,勇于承担起基于科研数据生命周期的科研数据管理服务工作,协同创新,嵌入一线科研环境,为临床科研项目增值,为医学事业发展贡献力量。


参考文献:

[1]江洪,钟永恒.国际科学共享研究[J].现代情报,2008(11):56-58.

[4]陈秀娟,吴鸣.美国健康医学图书馆数据服务[J].图书馆论坛,2016(10):114-120,封三.

[17]李芳薇,程瑾,张群,等.国外图书馆生物医学科研数据管理服务及启示[J].中华医学图书情报杂志,2015(8):5-10.

[18]李芳薇,吕婷,程瑾,等.国外生物医学科研数据管理服务与启示[J].中华医学图书情报杂志,2014(6):61-65.

[28]蒋丽丽,陈幼华,陈琛.国外高校图书馆数据馆员服务模式研究[J].图书情报工作,2015(17):56-61.

[29]孟祥保,钱鹏.国外高校图书馆数据馆员岗位设置与管理机制[J].图书与情报,2013(4):12-17.


文章来源:王玲玲.美国健康科学图书馆数据服务实践及启示[J].江苏科技信息,2021,38(34):9-13.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

图书馆学研究

期刊名称:图书馆学研究

期刊人气:863

期刊详情

主管单位:吉林省文化和旅游厅

主办单位:吉林省图书馆

出版地方:吉林

专业分类:图书

国际刊号:1001-0424

国内刊号:22-1052/G2

邮发代号:12-205

创刊时间:1980年

发行周期:半月刊

期刊开本:大16开

见刊时间:一年半以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定