91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

OBE理念下大数据技术开发课程教学的设计与实践

  2021-08-09    79  上传者:管理员

摘要:针对大数据技术课程教学存在的典型问题,基于OBE理念提出教学目标和评价方案,并以学生问卷调查入手,从平台层、数据层、预处理层、模型算法层、应用层及数据可视化分析层介绍大数据技术实践架构的创新设计,全面阐述课程的3个实验项目设计内容与要求,并给出线上实验指导与评价方法。在综合设计方面提出全面参与竞赛的项目策划,分别以全国大数据应用创新竞赛和"手写数字识别"项目为例,说明竞赛项目的良好效果。

  • 关键词:
  • 大数据
  • 实验项目
  • 成果导向教育
  • 技术架构
  • 教学设计
  • 综合设计
  • 加入收藏

随着大数据和人工智能技术的发展,专业建设与综合改革迎来了新的机遇,尤其是近几年来,除数据科学与大数据技术专业外,其他许多专业都增设了大数据技术类课程,不断调整课程体系,适应人才培养需求。例如,文献[1]中为计算机专业设置了大数据分析与应用课程体系,包括3门理论课和1门实训课,但是并没有阐述该体系在专业课程体系中的地位和能力指标要求。

文献[2]中基于大数据科研平台,设计了3个目标,采用学校的BDAP教学实验平台作为教学辅助工具。该平台封装了数据预处理、数据挖掘、社会网络、文本处理等多种算法,但是缺乏真实案例和编程实践,仅适用于导论课程用。文献[3]中对Hadoop系统课程的实验作了详细阐述,提出了大规模数据集的选取思路。文献[4]中提出了技能竞赛的思路,以探索大数据技术的开放教学模式,取得了良好的竞赛实践效果。

与此同时,部分高校已在探索以工程教育OBE理念进行大数据课程改革。例如,文献[5]中为大数据采集与分析课程,分配了9个毕业要求2级指标,设计了9个教学目标及其考核方式。不过,该课程支撑的目标过多,指标点分配也不够合理。文献[6]中针对旅游大数据分析课程,提出以培养大数据分析与解读能力为教学目标。另外,文献[7]中针对大数据开发技术课程,依托超星平台实施混合教学,但是该文献没有阐述具体技术开发的教学方式和考核方式,而且考试占比没有对应到相应的教学目标。

综上所述,目前结合OBE理念的课程教学偏少,有的缺乏真实案例。许多实验项目基于单机编程,没有在大数据平台下开展实验。此外,开放式竞赛的设计案例少。本课程基于工程教育的OBE理念,重在实验项目设计和实践的结合,通过Hadoop和Spark平台开展实验,并通过大数据应用创新竞赛项目,培养学生的创新设计能力。


1、课程教学目标及其评价方案设计


大数据技术及应用开发是计算机科学与技术专业的一门选修课程,理论要求适度,涵盖大数据的采集、存储、处理、可视化、分析与挖掘等处理周期,重在热门知识的应用和探索;突出技术开发的实战性,面向大数据背景下的人工智能技术应用与创新竞赛,开展文档处理、数据可视化和智能建模实践环节。

1.1 课程教学目标设计

专业在其毕业要求支撑矩阵表中,为该课分配的毕业要求2级指标点有3.4、4.3和12.2共3点,瞄准大数据技术方案设计、数据分析和热门技术跟踪等内容。因此,设计以下3个课程教学目标,且与上述3个指标点形成一对一的关系。

(1)课程目标1:通过Hadoop和Spark等系统的学习,学生能够设计大数据应用系统方案,建立大数据采集与存储的应用设计能力。

(2)课程目标2:基于大数据应用环境,学生能够编程实现大数据的查询和可视化分析。

(3)课程目标3:基于行业需求,学生能够不断探索大数据与人工智能结合的应用技术。

1.2 课程评价方案设计

在大数据技术类课程建设方面,必须考虑到学生如何获得以上能力目标,改革单一的考核方式,突出课程的形成性评价,增强学生的成果获得感,并不断激发学生的学习兴趣。因此,将本课程的考核方式设计为3种类型:实验教学、测验和综合设计。考核方式对课程目标的支撑关系见表1。其中,实验教学开展3个实验项目,测验包括平时测验和期末测验。

线上教学环境充分利用了蓝墨云班课和钉钉视频两个软件。基于蓝墨云班课环境(www.mosotech.cn),为学生共享教学资源、学生实验成果的评价和评论、轻直播教学、课堂测验等;基于钉钉视频软件,主要用于线上授课、实验验收和交流答疑等。

1.3 学情调查分析

为了更好地提高教学质量,须事先了解学生的技术现状。为此,开课之初,首先基于蓝墨云班课进行问卷调查,为教学内容和进度控制提供必要的参考。根据10道选择题的调查结果,不仅能发现总体分布情况,还能发现学生的弱项。

(1)从列向看所有学生对每道题的选择,能够通过统计结果发现群体差异。比如对选项“具有Python语言入门基础”,只有31%的学生勾选;再比如选项“了解Linux系统基础”,也只有34%的学生勾选。说明大部分学生还没有Python和Linux编程基础,因此在课内外需要补充这部分内容。

(2)从横向看每位学生对所有题的选择,能够发现某些学生对多数基础知识的缺项。比如有学生对于4个选项“具有Python语言入门基础”“了解HTML网页组成”“了解虚拟机知识”“了解Linux系统”都没有选择。

可见,教师需要格外关注选课学生的基础能力,保证学生有更充分的时间去开展实践,在教学过程中有针对性地辅导学生,找准学生的困惑并解惑。


2、大数据技术实践架构设计


基于本课程教学目标,大数据技术实践架构模型设计如图1所示。

本模型包括5个层次:平台层、数据层、预处理层、模型算法层和应用层。此外,数据可视化分析位于多层之中,属于共有内容。本架构模型具有下列特点。

(1)具有大数据平台系统要求:经调研分析发现,许多文献提到的大数据课程实验,在大数据平台实战方面都没有涉及,实验项目多停留在单机操作,缺乏集群环境。

(2)具有数据采集和存储管理功能:在大数据时代,数据是基础。学生学习大数据课程,如果不开展大规模数据的采集、互联网爬取和相关存储实践,而是停留在数据模拟方面,将无法适应实际工程项目需求。

(3)数据预处理:一些网络提供的竞赛数据,往往经过了数据清洗工作,稍作处理就可以用于经典的机器学习算法。而工程应用上的数据,多数情况下存在缺失、格式问题等。特别是涉及网页文档数据、图像和音频数据,其形式多样,规模较大,无法直接提交给智能算法,必须经过一些特征提取操作。

(4)具有模型与算法调用接口:人工智能模型与算法的选配,是培养学生解决大数据领域复杂工程问题能力的重要内容。基于实验目标,要求学生能够设计智能系统应用方案,并开展相应的实验,实现应用模型的优化。

(5)能满足具体应用需要:大数据技术实践课程不能停留在实验验证和数据应用上,而应基于模型算法层,通过学科竞赛等开放性的创新设计,完成具体的大数据应用项目设计,从而能将多个实践路径综合起来,培养小型应用系统设计能力。

针对大数据实验、综合设计等实践环节,应重点研究其支撑复杂工程问题解决能力的项目设计与效果评价方法。通常,每个实验项目突出一个主题设计,实验时间较短,往往是2—4学时,属于图1实践体系的某1~2个层次,而综合设计项目至少覆盖了图1中的大部分层次。


3、实验设计与技术分析


3.1 实验项目设计

本课程设计3个实验,分别覆盖图1的平台层、数据层、预处理层,后2个层次都涉及数据可视化分析内容。

(1)实验1:数据采集与可视化分析,覆盖图1的数据层和可视化通用层,培养学生对典型数据的分析能力,对应课程目标2。要求学生首先从互联网上获取数据,然后开展可视化设计,可视化插件选用Pyecharts。2020年的数据采集对象要求是全国的疫情数据,具有强烈的真实感,实现趋势图、直方图、地图等可视化展示。

(2)实验2:Hadoop/Spark系统的配置和测试,覆盖图1的平台层,培养学生的平台应用能力,对应课程目标1。除计算机实验室开放云平台可以使用之外,要求学生在个人电脑上完成Hadoop系统的伪分布配置,以及完成Spark平台,为后续实验提供基础。

(3)实验3:大规模中文文档处理程序设计,覆盖图1的预处理层和可视化通用层,培养学生对非结构化数据的分析能力,对应课程目标2。要求学生基于Spark平台,针对大规模中文文档,编程实现文档的停用词过滤和分词处理,提取文档关键词,并输出为词云图。这类中文文档,可以是长篇的小说、文献和网络评论文档等,让学生自行选择。

3.2 基于线上指导和评价的实验项目管理

实验教学绝不是简单的布置任务和批阅报告过程,而是要关注到学生的实验过程,由此获得学生学习成果的形成性评价。通过针对性指导和效果反馈,促使学生不断提高实验质量,并获得相应的设计能力。这种评价方法对实验管理提出了更高要求。在课内安排的实验学时往往不足,人多时间紧。而采用常规的电子邮件和短信,也无法适应这种快捷多人次的交互需求。采用线上教学平台,就很方便地解决了这个问题,能够实现多人、多实验项目、多轮次的线上指导和疑问跟踪,基于过程的形成性评价也就自然产生。

采用蓝墨云班课线上指导方式,针对某一位学生提交的数据可视化实验材料,教师进行评分和评论,学生据此进行改进后,教师可以再次评价。在评论区,师生能够开展无限次交流,大大扩展答疑空间和灵活性。


4、综合设计与实践


4.1 设计目标

基于工程教育专业认证标准毕业要求,应培养学生解决复杂工程问题的能力。落实到本课程,除理论教学之外,还有综合设计项目进行支撑。由此,对该项目提出2个设计要求。

(1)需要打通图1中的层次关系,实现从顶层的应用需求出发,完成数据获取、预处理、模型算法训练和可视化等整个过程。可见,要求项目目标能够支撑本课程的所有3个教学目标。

(2)需要采用合理的机器学习模型与算法,开展算法分析、模型训练和系统实现,这是难点。

4.2 项目策划

为了激发学生的学习兴趣,增强主动性,设计项目全部以竞赛题目为主,包括已完成的竞赛和正在进行的竞赛。2018年,本课程组织全体学生,以小组方式参加了“全国高校大数据应用创新大赛”地区赛。2019年,基于网络开放课题竞赛组织学生参赛。2020年受疫情影响,全部改为个人组,便于学生在家能够实施,同时为每人分配了选题。选题全部从以下DC竞赛网站选择。具体设计内容和要求都在该网站上有描述,让学生自行去查看,并通过注册后下载数据。部分选题见表2,全部选择学习为主的竞赛。


5、综合设计效果


2018和2019年,都组织学生参加了真实的比赛。比如,在2018年“全高校大数据应用创新竞赛”的区域赛中,本校有7个团队入围,其中特等奖1个、一等奖1个、二等奖5个,取得了优异的成绩。随后,荣获区域赛特等奖的学生团队积极参加了全国赛,荣获决赛三等奖。

2020年,受疫情影响,无法组织学生参加真实的公开赛。因此,调整为网络学习赛,能够根据提交结果获得排名。以项目“手写数字识别”为例,设计效果如下。

(1)采用K近邻算法KNN:使用包KNeighborsClassifier,直接计算最近距离样本来判断是属于10个分类哪一类,包括对图像进行灰度化处理,然后再对图片进行分类0—9。

(2)采用卷积神经网络CNN模型与算法:在加载数据后,经过数据清洗、归一化、Reshape、标签编码和分割交叉验证集,定义CNN网络模型,设置优化器和退火函数,再经过数据增强处理和拟合数据,就能进行预测。结果表明,CNN模型在数字识别上表现得优异。

学生提交结果后的排名情况调查中,采用CNN和KNN算法的,分别位于第1名和第3名。

经过3年的课程教学改革与实践,本课程达到了预期的教学设计目标,为计算机专业学生开拓了新的技术方向,受到了学生们的好评。


参考文献:

[1]王岩,杨森,黄岚.大数据分析与应用课程体系构建[J].计算机教育,2020(2):26-29.

[2]张翼飞,吴斌,王柏.基于科研平台的大数据初识课程实践[J].合肥工业大学学报(社会科学版).2019,33(6):138-144.

[3]梁晶,胡新荣.Hadoop大数据开发课程实践教学研究[J].计算机教育,2020(2):166-169.

[4]高志荣.大数据技术开放教学模式探索:基于技能竞赛的视角[J].绿色科技,2019(9):266-268.

[5]仲兆满,管燕.工程教育背景下大数据采集与分析课程教学设计[J].教育现代化,2019(101):189-193.

[6]张振国,陈艳.民族高校旅游大数据分析课程教学体系的构建[J].实验技术与管理,2019,36(11):234-236.

[7]褚福银,张秋林,刘佳.线上线下混合式教学在大数据开发技术课程的探索与实践[J].电脑知识与技术,2020,16(11):110-111.


文章来源:张晓明,李海生,陈明,王芳.基于OBE理念的大数据技术开发课程教学设计与实践[J].计算机教育,2021(08):166-170.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

上海教育评估研究

期刊名称:上海教育评估研究

期刊人气:516

期刊详情

主管单位:上海市教育委员会

主办单位:上海市教育评估院

出版地方:上海

专业分类:教育

国际刊号:2095-3380

国内刊号:31-2070/G4

邮发代号:4-886

创刊时间:2012年

发行周期:双月刊

期刊开本:16开

见刊时间:4-6个月

论文导航

查看更多

相关期刊

热门论文

推荐关键词

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定