智慧校园学生画像的文献综述
——常州市北环小学课题组
通过知网搜索关键字“数字化评价”“数据赋能评价”“学生画像”“智慧校园”等关键词,发现2018年前相关文献较少,但呈逐年上升趋势,2020年后,研究发文数明显上升。研究大部分集中在高校,初等教育的研究较少。
1.学生画像概念的研究
学习者画像的这个概念近几年才明确提了出来,在商业和教育领域还没有完全形成统一的概念和定义,但已经开始有许多的研究者对其概念进行了深入研究。
在国内,陈海建等一些人将传统商业应用领域的移动用户学习者画像的概念迁移到了教育领域,认为每一个学习者的画像就是对每一个学习者的特征进行了抽象化的客观概括和具体描述。顾小清等人的观点认为,画像应该是对每一个学习者的客观抽象和描述,依赖于有效的学习方法和行为分析数据。李光耀等研究者认为,首先将在线的学习行为碎片化的数据对学习者进行分析,形成了碎片化的行为数据和学习者信息,这些碎片化信息都反映了在线的个体各种的特征,通过不断分析和存储这些特征碎片化的信息,可以构建和形成对学习者的各种特征信息模型和集合,形成的模型和学习者肖像等信息的集合就是对学习者的画像。
在国外的研究中,用户画像通常被翻译成“User persona”,对应的学习者画像通常被翻译成“Learner persona”,根据不同学者的理解和研究,含义也各不相同。例如,Cooper 等人认为,学习者的画像就是把不同的学习群体根据他们自身具有的相同特征进行了划分。Dinh 等人在对 Cooper 的定义基础上,补充了对学习者画像的基本定义,认为学习者画像指的是用于描述虚拟学习群体的在特定学习情境下的共同行为特征。Judy 等人认为学习者群体画像是学习者基本信息的一个综合体。
2.学习者画像模型的研究
学习者画像模型是学习者画像构建的前提和基础,国内外关于学习者模型规范,具有代表性的包括 CELTS-11、IMS-LIP、PAPI 等学习者模型规范,其中,CELTS-11 规范是最符合中国教学实际情况的,从个人信息、偏好信息、绩效信息、学业信息等 8 个方面获取学生的特征信息,有助于各类学习系统获取、共享和交换学生在学习活动中的行为表现数据。但此规范缺少对学生个性特征的描述,如学生的知识水平、个人情感等。无法准确表征学生真实的学习状态。因此很多专家学者以此规范为基础,结合学生不可或缺的个性特征信息构建学习者模型,为学习者画像构建提供基础,不同研究视角的学习者画像模型相关研究如下表所示。
不同研究视角的学习者画像模型
研究者 | 学习者画像模型维度 |
陈海建等人(2017) | 基本属性、知识点兴趣、学习者类型、学习风格偏好 |
孙发勤等人(2020) | 一般特征、学习准备、行为特征、学习风格、偏好信息 |
顾小清等人(2016) | 学习过程、学习投入、学习结果 |
孙力等人(2017) | 个体属性、认知能力、学习风格、学习态度 |
菅保霞等人(2017) | 元认知能力、知识水平、认知水平、情感特征、错误/误解 |
王改花等人(2018) | 认知、意志、情感 |
Tuba Ketenci 等人(2019) | 背景经验、自我效能感、学习成绩、测验成绩、兴趣偏好 |
Phuong 等人(2012) | 学习策略、学习动机 |
Sankupellay 等人(2015) | 学习态度、学习动机 |
Rezgui 等人(2014) | 个人信息、目标、能力、语言偏好、学习风格、教育水平 |
通过上述分析可知,在学习者画像模型构建方面,大多数研究者关注的是学习者智力因素方面的特征信息,较少关注非智力因素方面的特征信息,而且普遍存在缺乏对学习场景特性的考虑,导致所构建的学习者模型不能够表征学生在不同学习场景中进行学习活动时的真实状态。为此,如何在学习者画像模型构建时,采集学习行为数据,增加非智力因素方面的特征信息,是学习者画像模型下一步研究的重点。
3.学习者画像构建及应用的研究
随着智能技术的不断发展,国内外已有众多学者在学习者画像构建与应用方面进行了深入研究。Yu 等人利用多元线性回归分析探究某一因素的多个变量,找出影响学习者表现的因素。Schroeder 等人采用 K-means 聚类算法,构建了基于参与者学习迁移测试分数的群体学习者画像,并基于此研究分数的影响程度。Piech 等人使用 RNN 算法预测学习者的认知水平,进而挖掘学习者画像。武法提等人提出了包含基本信息、学习风格、认知水平、兴趣偏好、情感状态和社会网络 6 个维度的学习者特征模型,采用频繁序列挖掘算法对场景感知进行建模计算,计算出在不同场景下学习者的特征值,进而构建了基于场景感知融合学习者特征的个性化学习者模型。唐烨伟等人使用了 SVM 聚类算法对学习者的八个行为特征进行筛选,构建了基于学习过程大数据的学习者画像。赵玲朗等人从数据采集、画像模型构建、画像生成、画像应用等方面提出了基于知识图谱的学习者画像构建方法。肖君等人从画像构建目标、数据收集、标签分析、画像服务输出等方面提出了开放学习者画像构建方法。余明华等人利用因子分析和聚类分析的方法,从画像构建目标、数据采集与预处理、画像构建、画像输出四个方面,提出了学生画像构建方法。
近年来,学习者画像的应用被学界广泛关注。学习者画像可以根据学习者不同维度的特征来划分学习者群体,实现针对不同群体给予不同服务支持,能够让教师生动直观的了解群体学习者和个体学习者的学习过程和学习状态,帮助教师为学习者提供个性化的指导与支持。基于学习者画像,系统平台等能为学习者设计学习路径、推荐个性化学习资源和提供个性化学习指导。Tzouveli 等开发了一种电子学习应用程序,根据学习者画像、使用历史和学习需求,推荐个性化学习资源。Park 等设计了个性化学习系统,将 ICT 技术与个性化指导相结合,实时跟踪学习者,根据学习者画像提供学习资料和个性化指导。王莉莉等人从学习数据获取、学习者画像构建、个性化课程推荐等方面提出了一种基于学习者画像的个性化课程推荐方法。肖君等人认为学习者画像以学习分析技术为基础,对教育大数据进行标签化,能够为学习者提供个性学习服务,从而提升学习者的学习体验。
4.学习者画像可视化的研究
学习者画像可视化是指学习者学习数据以图形、图表、图像的方式可视化展示,学习者画像可视化能够帮助教师和学生以更加直观的方式开到学习数据及其内在结构关系,为教师智慧教、学生个性学提供依据。
Liu 等人提出了基于 shapelet 算法来识别学习活动中的时间序列信息,并对信息进行跟踪,将学习者知识与能力掌握情况与学习者个人画像数据动态关联。Saptorshi 等人提出了一种从时间序列数据构造自然可见性图的高效非递归算法,并将时间数据同步处理,用以提升学习者画像可视化的精准性。Choudhary 等人利用 Visibility Graph 算法将学习者知识能力数据流转化为网络图,并以动态的方式实时呈现,以便直观展示学习者的知识与能力情况。姜强等人从社会比较理论的视角出发,认为学习者模型可视化不仅能够对学习者个体进行自我改进与强化,而且还能够帮助学习同伴内化知识,进而提高学习绩效。余明华等人认为,需要利用图像、图表、图形等可视化技术,将学习者群体画像与学习者个体画像直观呈现。肖君等人提出了根据学习者画像标签分析结果的画像可视化方法,学习者特征信息将由仪表盘可视化呈现,学习支持信息将以预警服务的图示可视化呈现。孙发勤等人通过机器学习对在线学习行为数据进行挖掘,以画像标签图的形式呈现了基于学习分析的在线学习用户画像。
综上所述,随着技术的进步和学习分析领域的持续发展,学生学习活动形式更加多样、数据种类更加丰富,需要更准确、全面、迭代优化的学生画像与评价分析,下面几点有待进一步研究:
(1)学生学习数据采集维度要多元。现在对学生数据的采集,大都基于学科的测试、练习、作业等数据和学生的学籍、健康指标等基本信息,而学生学习行为、深度学习表现、研究性以及实践性学习、德育等方面数据采集依然较少。
(2)需要构建符合多空间数据特征的综合素质评价框架。采集的数据具有多模态特征包括视频、语音、文字和图片等,亟需归一化标准和通用的评价框架,用于汇聚来自不同场景、不同模态的学习评价数据。
(3)需突破表感、认知、动机和社交评价方面的关键技术。以往的评价大多采用填报与统计方式,侧重知识掌握情况,重结果、轻过程。数据驱动下的精准评价,必须在情感、认知、动机等关键技术方面有所突破,通过采集文字、语音、图像、视频等包括认知、情感、注意力等的多模态数据,利用自然语言处理、图像识别、情感计算等深度学习技术和统计建模方法分析学习者的学习过程、学习内容、知识迁移、情感获得、交流互动等,进行全面、精准 、多维度评价与反馈。
(4)需引进或研发数据驱动的学习评价平台。为教育大数据的汇集融合、海量存储、高效计算、深入分析挖掘以及教育应用的开发与运行提供基础支持。基于学校现状,在已有平台基础上,需要进一步研究如何做到人机协同采集并分析评价学生学习过程。
(5)基于学生画像的学情建模与预警干预还有待落地研究。基于学生画像的应用,多是集中于某一维度的预测,或者规律的发现,集中高校。小学阶段基于学生画像的学情预警和干预的研究还有待补充。