91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:

发布论文

论文咨询

图书馆地方特色音频资源建设中DC元数据的应用

  2020-12-18    259  上传者:管理员

摘要:调研了国内外音频元数据研究和应用现状,研究了DC元数据及其在音频资源著录中的特点。以四川省图书馆“川阅之声”项目为例,列举具体的著录格式,提出DC元数据在特色音频著录应用中的建议,认为跟踪前沿元数据发展趋势、提高数字资源揭示水平是实现资源共享的有力途径。

  • 关键词:
  • DC元数据
  • 图书馆
  • 地方特色
  • 智慧图书馆
  • 音频资源建设
  • 加入收藏

引言


随着现代科技的发展,云计算、物联网、大数据、移动互联网等高科技技术让知识信息的获取变得非常便捷,新技术的诞生让知识和信息的形态呈现出多样化,也让阅读方式有了更多的可能。“听”的阅读方式在某种程度上是阅读这项活动本质的回归,并且能解放眼睛和双手。这样的方式更利于人们利用碎片化时间阅读,也越来越多地被人们接受和使用。地方特色音频资源建设内容成为地方特色资源建设的一大亮点,利用地方特色音频推进地方文化经典阅读更是一种创新。在各地地方特色音频资源建设的同时,对特色音频进行有效组织、揭示也成为建设过程中需要解决的问题。目前在基于地方特色音频信息组织与检索技术没有突破性进展的情况下,加强特色音频资源元数据的著录是特色音频资源组织行之有效的方式。


1、国内外音频元数据相关的研究和应用


1.1音频元数据

音频元数据是一种专门针对数字音频对象的描述数据,它以最基本的元数据规范书写模式为基准,整合与揭示音频资源的物理形态、内容和特征,为用户检索提供检索点和关联语句。音频元数据的著录离不开针对对象数据的分析,是建立用户与对象数据之间必然联系的关系节点。著录的内容包含了著录对象的分析、元数据的描述、层级关系和关联关系的体现、整体结构的搭建。

1.2国内外关于音频元数据的研究项目

音频元数据研究工作始于20世纪末,国内外多家机构和组织参与了音频元数据的研究。表1列出了国内外音频元数据研究的部分研究机构、相关项目和成果。

表1国内外音频元数据研究项目情况

表1列举了国内外涉及音频元数据研究的较大项目,其中国际音乐数据项目工作组隶属于美国音乐图书馆协会,该协会为其会员提供数据维护和培训相关的事宜。通过召开会议的方式开展元数据研究领域的调研和学术成果分享。韩圣龙在《音乐元数据研究现状》中提到,在该协会2001年的开发会议上,国际音乐数据项目工作组对元数据适用范围和领域进行了调研,针对36个与音频相关的元数据项目进行分析,将这些项目划分为六个领域,分别是机读目录(MARC)、编码档案描述方案(EncodedArchivalDescription,EAD)、都柏林核心元数据方案(DublinCore,DC)、音乐元数据标记语言(MusicMetadataMarkupLanguages)、美国记忆项目(AmericanMemoryProjects)中与音乐相关的部分和定义参数(DefinedParameters)[1]。

国内中国民族音乐数字图书馆项目为国际合作项目。郑巧英在《基于OAI协议的民族音乐数字图书馆互操作系统》一文中指出,清华大学、北京大学、上海交通大学联合申请国家自然科学基金重大项目“中华文化数字图书馆全球化的理论、方法和技术研究”。上海交通大学通过此次合作承担中国民族音乐数字图书馆的关键理论、方法和技术研究。其研究的主要内容是中国民族音乐的数字化处理方法、元数据的标准和规范等内容[2]。

通过调研发现,音频元数据研究项目主要集中在国外,相关的项目研究机构主要是音乐图书馆、音频协会或者数字图书馆等,研究成果服务于其会员机构,学术理论能够得到实践的检验,也组织较为成熟的学术交流会议以实现学术成果共享。国内最初的音频元数据研究项目数量较少,主要是因为国内的互联网技术起步较晚,元数据相关的研究最初也是始于国外,高校是主要的研究机构,研究内容都是建立在国外研究成果的基础之上,通过论文的形式,对国外已开展的研究内容进行扩展和实践。近几年随着国家图书馆、上海图书馆、中国科学院文献情报中心、清华大学图书馆和上海交通大学图书馆等机构的参与,陆续出台了关于音视频的著录规则,拓宽了元数据著录的文献资料类型,实现了传统元数据MACE和DC元数据之间的无障碍映射,指导着国内元数据著录的发展方向。DC元数据也随着数字图书馆的建设逐步运用到图书馆相关业务中。


2、DC元数据概述及其在音频资源著录中的特点


2.1DC元数据

在因特网迅速发展的过程中,集聚了大量、良莠不齐、无序的网络信息资源,在用户对搜索引擎准确、规范、有效查找和检索的需求推动下,DC元数据应运而生。DC元数据由15个核心元素构成,包含了描述性元数据、结构性元数据、关联性/连接性元数据和管理性元数据。15个核心元素分别是:名称(Title)、创建者(Creator)、主题(Subject)、描述(Description)、出版(Publisher)、其他责任人(Contributor)、日期(Date)、类型(Type)、格式(Format)、来源(Source)、语种(Language)、关联(Relation)、标识符(Identifier)、覆盖范围(Coverage)、权限管理(Right)。

2.2DC元数据在音频数字资源著录中的特点

DC元数据并不是专门用来描述音频类数字资源的,但是它的特点决定了它拥有强大的信息描述能力,能够广泛地应用于各个领域。

(1)简易性。DC元数据只有15个元素,任何一个元素的描述都是可以独立存在的,并且不依赖具体的编码方式,支持含有简单信息语句的元数据内容,格式简单易于理解并且操作简易,就算是非著录专业性人员也能够进行著录。

(2)灵活性。15个核心元素可以选择其中部分元素进行组合,每个元素下可以划分多个元素修饰词,每个元素可重复一次或者多次。特色音频数字资源具有该资源特有的音频属性和文献属性,可以根据音频资源的内容与特征选择需要著录的元素,也可以增加、细分或者重复著录的元素[3]。

(3)兼容性。目前很多常用的浏览器都提供对DC的支持,由于DC运用简易灵活,很多数据库都采用其结构模块,与图书馆文献常用元数据MACE之间能无障碍映射,其基础模块结构具有结构化元素编码、转换的能力。四川省图书馆“川阅之声”特色音频是地方特色音频中的一个子项目,在建设过程中需要考虑与其他特色音频库的兼容性。


3、四川省图书馆“川阅之声”项目情况


3.1“川阅之声”项目概论

3.1.1项目实施的内容和目的

近年来,随着公共数字文化工程地方特色文化资源建设工作的推进,各地公共数字图书馆在建设过程中不断思考创新,期望用最新的技术、最便捷的方式传递本土特色文化资源内容。

四川话作为四川地区主要流通的方言,承载着历史悠久的巴蜀文化,是四川人民归属感和认同感的体现,具有重要的语言价值、历史价值,是传统文化传承和发扬的重要载体。2020年四川省文化和旅游厅提出了建设“川阅之声”自有版权阅读类品牌项目的要求,用声音的方式传播和记录四川地方特色文献,包括与四川人文、地理、风貌、文化、民俗等息息相关的各类文献、诗词歌赋、景观美食、曲艺等内容,旨在建设成具有地域特征的特色音频资源库。最终成果以网络为载体,让读者可以通过听书的方式来阅读四川经典文化,赋予全民阅读新内容、新形式、新内涵。打造“川阅之声”品牌的同时,建立四川地方音频阅读资源库,将地方文化和文学经典以文献、有声读物、古典唱曲的形式系统、完整地地保存和传承。

3.1.2项目的形态及特点

“川阅之声”项目主要是用四川方言以“说、唱、读”等方式建设适合群众的方言听书的自有版权阅读类资源。项目的成果形态主要是音频资源,具有强烈的数字资源属性,内容更多的通过数字资源格式进行存储和呈现,在建设过程中需要更多地考虑资源组织与揭示的建设。一个成品资源内容包括该内容承载的对象数据和用于描述对象数据的元数据。

“川阅之声”项目对象数据库特点是为了满足读者使用碎片化时间,单集或单个音频的时间控制在10~15分钟左右,内容可以是一本书、一篇文章、一部戏曲、一个景点等,分集建设。

“川阅之声”项目元数据著录主要体现为音频元数据著录,既要考虑原生载体的数据内容也要考虑新生载体的数据内容,需两者结合。要以资源管理者的角度思考对于阅读类地方特色音频的有效开发、管理和揭示。

3.2DC元数据在“川阅之声”项目的著录

3.2.1DC在“川阅之声”项目的著录格式

由表2可以看出,DC元数据15个元素基本能够包含资源特性的描述,基本框架成熟,作为网络信息资源著录格式,对元素修饰词没有特别的限定,完全可以根据项目的特性和要求进行设置。

(1)creator(创建者)元素,考虑到“川阅之声”特色音频资源是属于文字文献通过音频方式再次加工创作的特点,元素修饰词设置为文献作者和播者,即同时兼顾了文字文献作者的著作权益和音频播者的创作权益。

(2)description(描述),元素修饰词设置为内容介绍、分集总数、背景音乐、小集题名信息,通常一本文献里面包含很多章节,在录制音频资源的时候,根据章节内容作分集处理,并能详细的著录到每一小集的相关提名信息,对内容著录可以做到更加细化。

(3)date(日期),元素修饰词设置为文献出版日期和音频创建日期,两个日期的著录,在资源平台检索时可以根据日期类型筛选更为准确的揭示到对应的内容。

(4)format(格式),元素修饰词设置为格式、时长、大小(电子文件)、编码格式、数据码率、采样频率、位深度、声道格式、媒体这些内容更为全面的著录对象数据的相关物理信息。

(5)“川阅之声”特色音频资源项目实施对象主要为四川省公共图书馆,最终会运行于网络平台,在最后增加了发布地址、数据提交单位和馆藏信息元素。

3.2.2DC著录的文件样式

DC数据向XML格式的转换过程,实际上是将DC元数据元素解析为软件能识别的数据描述格式,从中调取所需的DC对象,添加符合DTD的XML树中,生成XML文档的过程[4]。在这个过程中需要配合运用资源描述框架RDF。

表2DC元数据在“川阅之声”项目的著录格式


4、DC元数据在音频著录运用中的建议


4.1主题与关键词项需精准描述

DC元数据著录的主观随意性较大,特别是主题和关键词著录上的不规范会影响到最终资源的检索和揭示效果,首先需要建立规范的检索词表。表1中编码体系修饰词的限定可以在一定程度上起到规范的作用。如subject(主题)编码体系修饰词可以采用汉语主题词表(CT)或中图分类主题词表(第二版),通过选用规范的词表著录能提高检索效率和准确率。

4.2DC元数据标准的著录格式的统一

统一DC元数据标准的著录格式,规范每一条著录内容。比如,日期描述的统一格式,通常会用YYYY年MM月DD日来表示,也可以用YYYY-MM-DD;地理位置的规范著录,主要有地理名称(name)、地理代码(geocode)、经纬坐标(point)等,地理位置对应到DC的核心元素“覆盖范围(coverage)”“空间(spatial)”,具体著录内容需要对描述字段进行限定或约束,结合项目实际来进行规范。

4.3核心元素扩展的规范化

表1中核心元素扩展为多个元素修饰词,在扩展过程中元素修饰词必须与原核心元素语义定义上保持一致,即元素修饰词的语义归属于核心元素语义中,不能超出其语义范围,并备注语义及说明,确保著录内容准确有效。

4.4资源的合理组织和准确揭示

首先,需加强普及DC元数据现有著录标准和规范,积极开展著录标准和规范的培训,培养一批DC元数据应用的专业人员。其次,在运用和实践的过程中引入国际元数据著录标准和规范的成果,根据中华文化特点进一步地提炼和把握。

4.5强化国际合作,提高学术能力

组织优秀的专业人员参与相关国际研讨会、国际合作、撰写学术报告、展示实践经验。DC元数据的研究不仅仅局限于图书馆领域,要加强各领域合作,吸取社会各界专家的意见,从而提高行业学术能力。


5、结语


近年来,DC元数据在国内不少领域得到了很好的利用和发展,图书馆行业作为DC元数据的主要应用领域,要培养资源建设的专业人员对DC元数据的认识和使用,跟踪最前沿的元数据技术发展趋势,参与更为深入的研究性工作,加强国际合作,提高数字资源揭示的效率和水平,最终实现各种类型资源的充分描述、有效揭示,消除资源共享的技术壁垒,推动我国数字图书馆建设进程。


参考文献:

[1]韩圣龙.音乐元数据研究现状[J].大学图书馆学报,2007(2):67-72.

[2]郑巧英,杨宗英.基于OAI协议的民族音乐数字图书馆互操作系统[J].上海交通大学学报,2009(9):230-238.

[3]李林华.都柏林核心与网络信息资源编目[J].图书馆杂志,2001(3):17-19.

[4]李航,王臻.基于XML/RDF的元数据描述在数字图书馆的应用[J].情报探索,2014(12):133-135.


杜卓倩.DC元数据在图书馆地方特色音频资源建设中的应用——以四川省图书馆“川阅之声”项目为例[J].四川图书馆学报,2020(06):46-50.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

数字图书馆论坛

期刊名称:数字图书馆论坛

期刊人气:2027

期刊详情

主管单位:科学技术部

主办单位:中国科学技术信息研究所,南京大学,北京万方数据股份有限公司

出版地方:北京

专业分类:图书

国际刊号:1673-2286

国内刊号:11-5359/G2

邮发代号:80-414

创刊时间:2005年

发行周期:月刊

期刊开本:大16开

见刊时间:1年以上

论文导航

查看更多

相关期刊

热门论文

推荐关键词

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定