2020-06-22
217
上传者:管理员
摘要:高校图书馆图书借阅流量受到多种因素的综合作用,具有十分强烈的随机性,而当前高校图书馆图书借阅流量预测方法无法准确描述随机性变化特点,使得高校图书馆图书借阅流量预测误差大,结果可信度低。为了提高高校图书馆图书借阅流量预测精度,提出了基于数据挖掘的高校图书馆图书借阅流量预测方法。首先对高校图书馆图书借阅流量的国内外研究时展进行分析,找到引起高校图书馆图书借阅流量预测误差大的原因,然后采用混沌理论对高校图书馆图书借阅流量历史数据进行分析,并采用数据挖掘技术对高校图书馆图书借阅流量变化特性进行拟合,建立高校图书馆图书借阅流量预测模型,最后采用实例对高校图书馆图书借阅流量预测效果进行了测试。结果表明,高校图书馆图书借阅流量预测精度超过95%,远远高于高校图书馆管理要求的85%,而且高校图书馆图书借阅流量建模效率得到了大幅度改善。
加入收藏
引言
随着高校不断的发展,高校的各项指标都得到了大幅度提升,图书馆的藏书数量也来越大,给图书馆管理带来一定的挑战[1,2,3]。图书馆借流量可以描述大学生使用图书馆藏书频率,这样可以帮助图书馆管理人员采购书籍提供帮助,国此如何提高高校图书馆图书借阅流量预测精度具有十分重要意义[4,5,6]。
高校图书馆图书借阅流量受到学生学习习惯、学习时间、爱好以及其它因素的影响,是一种具有随机性变化比较强的时间序列数据,而且具有一定的混沌性[7]。当前高校图书馆图书借阅流量预测研究可以划分为两个阶段:第一个阶段为线性建模方法,主要有:差分自回归移动平均方法、多元线性回归方法等,它们认为高校图书馆图书借阅流量是一种固定增长或者下降的变化态势,然后对高校图书馆图书借阅流量预测模型的参数进行估计,从而实现高校图书馆图书借阅流量预测,由于高校图书馆图书借阅流量不只是一种变化态势,尤其对于现代高校图书馆,其预测误差比较大[8,9];第二个阶段为非线性建模方法,主要有:模糊算法、神经网络、支持向量机等高校图书馆图书借阅流量预测方法,它们从非线性角度出发,对高校图书馆图书借阅流量变化态势进行跟踪,高校图书馆图书借阅流量预测精度要高于线性建模方法。在实际应用中,高校图书馆图书借阅流量复杂多变,单一的模型无法对其变化特性进行全面描述,因此高校图书馆图书借阅流量预测效果有待进一步改善[10,11]。
针对当前高校图书馆图书借阅流量预测误差大,可信度低缺陷,提出了基于数据挖掘的高校图书馆图书借阅流量预测方法,并通过具体高校图书馆图书借阅流量预测实例分析了本文方法的优越性。
1、数据挖掘技术
1.1极限学习机算法
设一个预测问题的训练集为:{(x1,y1),(x2,y2),…,(xn,yn),采用极限学习机可以建立,如式(1)。
公式(1)
式中,αi、βi表示输入权值,bi表示输出偏差。
对式(1)进行变换,通过矩阵方式进行描述,得到式(2)。
f(x)=h(x)⋅β (2)
式中,h(x)为神经元矩阵,如式(3)。
公式(3)
采用LS算法,对极限学习机的βi最优值进行求解,如式(4)。
根据βi可以得到问题的预测模型,如式(5)。
y=∑i=1Lβif(αix+bi) (5)
1.2最小二乘支持向量机
对于一个预测问题的训练集:{(x1,y1),(x2,y2),…,(xn,yn),引入变换φ(·)对输入和输出之间的关系进行映射,如式(6)。
f(x)=wTφ(x)+b (6)
对式(6)进行求解,因此需要对其进行相应的变换,从而得到一个带约束的优化形式,如式(7)。
采用拉格朗日乘子αi对式(7)进行处理,得到其等价形式,如式(8)。
L(w,b,ζ,α)=12wTw+12γ∑i=1nζ2i+ ∑i=1nαi(wTφ(xi)−b+ξi−yi) (8)
根据条件∂L∂w=0,∂L∂b=0,∂L∂ξi=0,∂L∂αi=0得到式(6)参数的值如式(9)。
w=∑i=1nαiφ(xi) (9)
引入核函数代替内积运算:K(xi,xj)=φ(xi)Tφ(xj),最小乘支持向量机的预测,如式(10)。
f(x)=∑i=1nαiK(xi,xj)+b (10)
式中,K(xi,xj)定义,如式(11)。
2、基于数据挖掘的高校图书馆图书借阅流量预测方法的具体设计
2.1高校图书馆图书借阅流量数据的预处理
高校图书馆图书借阅流量历史数据{x(t),t=1,2,…,n}是一个一维数据,因此无法直接进行建模,需要将其变一个多维数据,结合高校图书馆图书借阅流量的随机和混沌性变化特性,因此本文采用混沌理论的相空间重算法将原始高校图书馆图书借阅流量历史数据变为一个多维数据,如式(12)。
X(t)=[x(t),x(t+τ),…,x(t+(m-1)τ)],t=1,2,…,M(12)
式中,M=n-(m-1)τ,τ和m分别表示延迟时间和嵌入维数。
对式(12)进行分析可以发现,重构后的高校图书馆图书借阅流量数据与原始高校图书馆图书借阅流量数据具有同样的变化轨迹,但是重构后的高校图书馆图书借阅流量数据更加有利于建模和预测。
2.2高校图书馆图书借阅流量预测方法的工作步骤
(1)通过高校图书馆管理系统统计高校图书馆图书借阅流量的历史数据,对于缺失的数据通过一定的规则进行补。
(2)采用混沌分析算法对高校图书馆图书借阅流量的延迟时间和嵌入维数进行确定。
(3)根据延迟时间和嵌入维数对高校图书馆图书借阅流量历史数据进行重构,从而到一个多维的高校图书馆图书借阅流量历史数据。
(4)根据一定的比例将高校图书馆图书借阅流量历史数据划分为两部分:训练样本集和测试样本集,训练样本集用于训练极限学习机或者最小二乘支持向量机,找到它们的最优参数,从而建立相应的高校图书馆图书借阅流量预测模型。测试样本主要对高校图书馆图书借阅流量预测模型的可行性进行分析。
(5)对极限学习机的相关参数进行初始化,极限学习机对高校图书馆图书借阅流量的训练样本集进行学习,建立基于极限学习机的高校图书馆图书借阅流量预测模型,并对高校图书馆图书借阅流量的测试集进行预测,并输出相应的预测结果。
(6)对最小二乘支持向量的相关参数进行初始化,最小二乘支持向量对高校图书馆图书借阅流量的训练样本集进行学习,建立基于最小二乘支持向量的高校图书馆图书借阅流量预测模型,并对高校图书馆图书借阅流量的测试集进行预测,并输出相应的预测结果。
(7)确定极限学习机和最小二乘支持向量的权值,并对它们的高校图书馆图书借阅流量预测结果进行组合,从而得到最终的高校图书馆图书借阅流量预测结果。
综合上述可知,基于数据挖掘的高校图书馆图书借阅流量预预测流程,如图1所示。
图1基于数据挖掘的高校图书馆图书借阅流量预测流程
3、仿真实验
3.1数据来源
为了测试基于数据挖掘技术的高校图书馆图书借阅流量预测效果,采用一个高校图书馆图书借阅流量历史数据作为应用实例,共得到300个数据,如图2所示。
图2某高校图书馆图书借阅流量值
从图2可以发现,该高校图书馆图书借阅流量历史数据的变化比较复杂,为了使数据挖掘技术的高校图书馆图书借阅流量预测结果更具说服力,选择单一的极限学习机高校图书馆借阅预测模型和最小二乘支持向量机的高校图书馆借阅预测模型进行对照实验。
3.2确定延迟时间和嵌入维数
采用混沌分析算法对图2的高校图书馆图书借阅流量数据进行处理,得到最优延迟时间为:6,最优嵌入维数为7,如图3所示。
图3借阅流量数据的延迟时间和嵌入维数
这样根据此结果得到一个多维的高校图书馆图书借阅流量数据。
3.3高校图书馆图书借阅流量预测准确性分析
统计3种高校图书馆图书借阅流量预测值和实际值之间的偏差,结果如图4所示。
图4高校图书馆图书借阅流量预测偏差
对图4进行分析可以得到如下结论。
(1)极限学习机和支持向量机的高校图书馆图书借阅流量预测偏差比较大,而且变动的范围也很大,出现了许多不稳定的高校图书馆图书借阅流量预测点,这是因为高校图书馆图书借阅流量变化复杂,单一模型只能对一个变化特点进行建模,无法全面描述高校图书馆图书借阅流量变化特点。
(2)本文模型的高校图书馆图书借阅流量预测偏差小,而且变化相当平稳,没有太大的起伏,这表明本文模型的高校图书馆图书借阅流量预测结果比较稳定,而且高校图书馆图书借阅流量预测精度更高,这是因为本文方法从两个方向对高校图书馆图书借阅流量变化特性进行拟合,能够降低高校图书馆图书借阅流量预测误差,克服了单一模型的局限性。
3.4高校图书馆图书借阅流量预测的建模效率分析
由于高校的学生数量不断增加,使得高校图书馆图书借阅频率不断上升,这样校图书馆图书借阅流量建模效率直接影响校图书馆管理效率,采用高校图书馆图书借阅流量预测的建模时间分析建模效率,为了体现实验结果的公平性,每一种方法均进行5次仿真实验,高校图书馆图书借阅流量预测的建模时间,如表1所示。
表1高校图书馆图书借阅流量预测建模时间
从表1可以知道,最小二乘支持向量机的高校图书馆图书借阅流量预测建模时间最长,其次为极限学习机,最短为本文方法,这是因为本文首先采用混沌分析算法对高校图书馆图书借阅流量数据进行处理了,有利于后续的高校图书馆图书借阅流量建模训练,而对比方法均没有采用混沌分析算法对数据进行处理,而是直接进行建模和预测,因此本文方法改善了高校图书馆图书借阅流量建模效率。
4、总结
高校图书馆图书借阅流量受到多种因素的综合作用,具有十分强烈的随机性变化特性,而当前高校图书馆图书借阅流量预测方法无法准确描述随机性变化特点,使得高校图书馆图书借阅流量预测误差大,结果可信度低,为了提高高校图书馆图书借阅流量预测精度,提出了基于数据挖掘的高校图书馆图书借阅流量预测方法。首先采用混沌理论对高校图书馆图书借阅流量历史数据进行分析,然后采用极限学习机和最二乘支持向量机分别对高校图书馆图书借阅流量进行建模和预测,最后对极限学习机和最二乘支持向量机的高校图书馆图书借阅流量预测结果进行组合,测试结果表明,本文方法的高校图书馆图书借阅流量预测精度高,建模效率得到了大幅度改善,具有十分广泛的应用前景。
参考文献:
[1]雷崇鸽.网络新媒体环境下高校图书馆提高图书借阅量的策略分析——以西安电子科技大学图书馆为例[J].教育现代化,2019,6(23):193-194.
[2]宋楚平.一种改进的协同过滤方法在高校图书馆图书推荐中的应用[J].图书情报工作,2016,60(24):86-91.
[3]山洁,陈淑英,李新民.基于网络和节点属性模型的大学生阅读倾向分析[J].情报探索,2016(12):57-61.
[4]牛秀.基于多参数指数平滑的图书借阅量预测[J].科技情报开发与经济,2011,21(28):50-51.
[5]于曦.基于Unicorn和SPSS的图书借阅量周期性分析及预测[J].山东图书馆学刊,2011(1):52-56.
[6]陈明.一元线性回归模型预测图书借阅量[J].大学教育,2016,21(5):111-112.
[7]严慧英,朱辉.阅读推广对高校图书馆借阅量影响的实证分析[J].图书馆研究与工作,2016,7(2):40-44.
[8]汪玉杰,刘智立.基于BP神经网络对图书借阅量的预测研究[J].科技创新与应用,2013,36(5):25-26.
[9]邹梅.利用神经网络技术预测图书借阅量[J].兰台世界,2013(20):135-136.
[10]张囡,张永梅.基于灰色神经网络的图书馆图书借阅量预测[J].情报探索,2013,12(3):133-135.
[11]刘素兵,刘海明,苗佳晶,等.图书借阅量的灰色回归组合模型研究[J].云南民族大学学报(自然科学版),2010,19(3):170-172.
陈桂菊.基于数据挖掘的高校图书馆图书借阅流量预测[J].微型电脑应用,2020,36(06):93-96.
分享:
高校图书馆被誉为“大学的心脏”,与教师、实验室并称为高校办学的“三大支柱”。教育部印发的《普通高等学校图书馆规程》明确指出,“图书馆的主要职能是教育职能和信息服务职能。图书馆应充分发挥在学校人才培养、科学研究、社会服务和文化传承创新中的作用”[1]。作为高校人才培养体系的重要组成部分,高校图书馆担负着育人的职责和使命。
2024-08-30中小微企业是国家经济发展、产业结构调整、科技创新等方面的重要影响因素。新时代的今天,中小微企业迎来了重要发展机遇,各地政府从资金、设备、平台和政策等多方面出手相助,中小微企业中的科技型、创新型企业有着显著的思路灵活、充满活力、创新活跃等特征。它们拥有高精尖人才和很强的科研能力,同时也存在着明显的短板,比如资金少、人员不足、管理经验缺乏、信息获取渠道匮乏等。
2023-12-04近年来,专业课程教学过程融入思政教育的新理念受到广泛的关注[6]。基于此,南华大学不仅将思政元素融入课程教学大纲,还将课程融入思政作为课程教学评价的核心指标。此外,南华大学每年还会举办一系列的思政教育教学活动,如举办思政教育教学竞赛,邀请专家对专业教师进行培训,组织教师申报思政教育类相关项目等,显著提升了课程的教学效果。
2023-12-01根据新时代发展需要,本科教育发生了很大变化,线上线下相结合的教学方式,冲击着传统的教学模式。图书馆作为面向高校本科教学的服务资源保障机构,也要契合高校教学改革要求,找准定位、服务师生,深化本科教学课程支持服务,完善本科教学服务平台,拓展读者个性化服务范围,通过构建全新的服务体系,提供新的服务手段及服务内容
2023-07-07在互联网技术与新媒体技术飞速发展的背景下,自媒体已经完全融入人们的日常生活和学习工作中,本文介绍了高校图书馆自媒体平台咨询服务的优化意义、具体特征与优化方法,以通过进一步提升高校图书馆自媒体平台询服务水平的方式,满足高校读者以及图书馆方面的发展需要,希望能够给读者带来启发。
2022-04-30随着信息化、智能化、智慧化时代的发展,信息素养成为了大学生需要具备的一项重要能力,对信息素养教育的探讨也成为了教育学者热烈讨论的问题,随着这一学科的普及,高校对其重视程度也在不断的增加。学生对知识渴求的欲望越来越大,对信息的需求也越来越多,这就迫使高校图书馆在原有知识体系的基础上不断引进新的题材。
2022-03-30信息技术广泛应用提升了各行业的工作效率,图书馆工作为实现智能化发展目标引入了信息技术,以期提升服务水平及信息资源智能化水平。研究对信息技术的应用特点和作用进行阐述,并对当前图书馆管理工作存在的问题进行分析。研究从多个角度分析信息技术对图书馆工作的影响,并提出信息技术应用下图书馆未来发展对策。
2022-03-30高校图书馆是对大学师生提供信息服务的主要机构,在大学生成长和发展的关键时期,可以在大学师生的专业学习、人文素养、思想修养等方面发挥重要作用。文章对高校图书馆专题电子资源服务的相关技术问题进行探讨,从专题网站资源导航、校外访问资源以及移动端资源三方面进行阐述。
2022-03-29随着大学生阅读需求与方式的变化,目前高校图书馆图书借阅量呈现下降的现状。文章以笔者所在馆为例,对高校图书馆新书管理及推广服务情况进行了调研与分析。针对调研结果及问题,提出了今后新书管理与宣传推广的新方法,比如设立新书专架、建立特色图书专架、改善阅览环境、多种途径宣传推广等。
2022-03-29文章通过文献和网站调研,分析归纳我国高校创客教育的研究现状及活动形式,并在此基础上分析高校图书馆在创客教育中的角色,提出高校图书馆可以提供四个方面的服务:一是发挥公益性效能,提供社会化服务;二是构建创客空间;三是促进创客文化生成;四是提供信息资源保障和知识服务。
2022-03-08人气:4410
人气:2788
人气:2620
人气:2603
人气:2588
我要评论
期刊名称:数字图书馆论坛
期刊人气:2025
主管单位:科学技术部
主办单位:中国科学技术信息研究所,南京大学,北京万方数据股份有限公司
出版地方:北京
专业分类:图书
国际刊号:1673-2286
国内刊号:11-5359/G2
邮发代号:80-414
创刊时间:2005年
发行周期:月刊
期刊开本:大16开
见刊时间:1年以上
影响因子:1.973
影响因子:0.664
影响因子:0.707
影响因子:0.716
影响因子:1.057
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!