书合文秘网 - 设为首页 - 加入收藏
当前位置 首页 > 范文大全 > 公文范文 >

国际视野中的在线交互与网络分析:回顾与展望

作者: 浏览数: 关键词: 在线 交互 展望 视野 回顾


打开文本图片集

[摘   要] 在线学习呈现大规模性、开放性、灵活性、动态性等特征,使得学习交互的本质发生了变化,亟待新的研究理论与方法来发现交互与演化的新规律。学习与交互不仅仅局限于小组之中,个体之间的交互正通过某种形式不断延展开来,形成一个交互的网络,使得从网络分析的视角对学习与交互展开研究成为可能。研究选取23篇英文论文作为文本数据,从网络分析的重新词化、基本特征、常用网络指标、数据筛选方法、研究问题、理论框架、模型与方法等多个方面,对使用网络分析方法探究在线学习交互的研究进行了系统分析。研究发现,网络分析是研究在线学习大规模交互的重要方法,但传统的静态网络分析指标不足以支撐对在线学习交互展开深入研究,网络的动态演化机制将成为新的趋势和研究重点,相关实证研究亟待开展。基于多学科理论,将如何剔除交互数据中的“噪音”作为研究设计的一部分,综合运用网络分析、内容与文本分析、统计分析等方法,开展实证研究将帮助人们重新认识社会化学习与开放灵活的在线学习,使得新理论的产生成为可能。

[关键词] 在线学习; MOOC; 网络分析; 交互

[中图分类号] G434            [文献标志码] A

一、在线交互与网络分析

2012年,数以百万计的学习者选择参加大规模开放在线课程(Massive Open Online Course,简称MOOC),与不同文化、教育背景的学习者共同学习。在线学习的大规模性使得交互的本质发生了改变,亟待新的研究方法来发现交互的新规律。内容分析或话语分析在早期交互研究中被广泛使用。尽管这些方法具有重要的意义,然而在以MOOCs为代表的在线学习中,一门课程中数以千计的学习者产生的大量且非结构化的交互数据,使得传统的研究方法呈现出一定的局限性。MOOCs在线交互产生的“电子踪迹(Digital Traces)”让研究者能够获取到以往传统教育研究中无法采集的数据,如考试前学生查阅课本频率、在期末考试前学生交流频次等[1]。大规模学习产生的海量数据相比于以往计算机协作学习(CSCL)环境下的数据,呈现出截然不同的特征,其表现在数据量之大、传播速度之快、数据种类之多和不同程度的可信性[2]。Mcauley等提出,大规模学习中采集的数据多为自然浮现的(Emergent)、碎片化的(Fragmented)、弥散化的(Diffuse)和多样的(Diverse)[3]。具有大数据特征的这些海量数据为研究学习交互提供了新的机遇与挑战。研究者除了关注交互的内容,还更加关注交互个体之间的关系,由此形成交互模式以及背后的交互机制[1,4]。

大规模学习的兴起,使得交互不仅仅局限于小组之中、个体之间的交互,而是通过某种形式,不断延展开来,形成一个交互的网络。越来越多的研究者选择网络分析法(Network Analysis)对交互数据进行分析,将行动者抽象为节点,将关系抽象为点与点之间的边,形成一个社群图,从而描述网络关系。其中,关系可以是有向的,也可以是无向的;可处理为加权的,也可简化为非加权的。研究者可以借助社会网络指标(如度数、中心性、密度等),从不同角度,对宏观网络、中观子群和微观个体展开探索。网络分析法能够帮助研究者更清晰地了解到个体以及个体之间在整个网络之中空间上与时间上的动态变化趋势,有助于教学组织者对学生的学习进行预测,对智能系统开发以及教师干预等起到了重要的推动作用[5]。

在过去几年,已有一些研究者对网络分析,特别是社会网络分析(Social Network Analysis, 简称SNA)展开了综述。例如:Cela等对SNA在在线学习领域的相关研究进行了系统的分析,提出SNA与统计方法和内容分析方法相结合,可用于解读交互的本质与类型,用于优化课程设计、发现潜在辍学者并进行干预等[6];Sie等针对SNA在技术增强学习(Technology-Enhanced Learning,简称TEL)中的应用进行了系统的综述,对数据收集、网络指标、SNA应用中的三种呈现形式(可视化、分析和干预)进行了详细的阐述,提出通过网络模拟仿真来预测或者推断学习行为[5];Aditomo和Reimann从境脉、研究对象、分析工具等方面对SNA的优势与不足进行了综述,发现并非所有的研究者都对数据收集的方法进行描述,明确提出数据筛选和网络指标的选择是未来研究需要重点关注的方面[7]。在这些研究的基础上,本研究从网络分析的重新词化、基本特征、常用网络指标、数据筛选方法、研究问题、理论框架、模型与方法等维度对在线学习交互研究中的网络分析展开综述。

二、研究方法

本研究在Springer、Web of Science、 Science Direct 数据库中,使用关键词“MOOC(s)/Online Learning/Virtual Community/Distance Learning”“Network Analysis/Social Network Analysis”“Forum/Interaction”,对2007年至2017年发表的论文进行筛选。最后,本研究共获得23篇学术论文,其中包括20篇SSCI期刊论文、3篇发表于教育数据挖掘和学习分析年会的文章,作为本研究的原始数据,从网络分析的重新词化、基本特征、常用网络指标、数据筛选方法、研究问题、理论框架、模型与方法等方面进行归纳和总结,为研究在线学习交互提供重要的手段与依据。

三、研究结果

(一)网络分析是什么?

大部分研究者将网络分析重新词化为方法或工具,如“Approach”“Technique”“Method”“Measures”“Means”“Methodology”“Tool”“Way”等。另有一部分研究者对网络分析进行描述的时候,则将它重新词化为理论或领域,如“Lens”“Perspective”“Theory”“Field”“Concept”等。

(二)网络的基本特征

网络的数据来源主要分为以下几个大类:MOOC、学习管理系统(Learning Management System,简称LMS)、虚拟学习社区(Virtual Learning Community,简称VLC),数据的来源决定了所构建网络的规模(一般为社会网络的节点数)。MOOCs和LMS的数据量相对较大,网络规模可达上千甚至更多。而传统的在线课程或与学校教学结合的社区平台可提供的数据量则比较少,多为几百或几十。网络基本特征的选取,如是否有向、是否加权、是否考虑教师作为行动者、网络是动态还是静态等则多由研究主题和问题决定。例如:在Skrypnyk 等的研究中,社会网络关系是有权重的,因为权重可以用于表示个体在网络中的重要程度等特征[8]。而Zhu等在他们的研究中就没有关注关系的权重,而是更关注是否存在回复或评论关系[9]。对于是否将教师作为行动者,不同研究的处理也是不同的。有的研究将教师作为网络的一个部分,研究整个网络中中心性相关指标的变化情况[10]或动态演变过程[4];有的研究则将教师角色的参与与否作为研究的问题,分别对有教师参与和无教师参与的网络进行社会网络分析[11]。大多数的网络为静态网络,也有研究从网络动力学的视角使用SIENA(Simulation Investigation for Empirical Network Analysis)进行动态网络分析[4]。

(三)网络分析的指标及其含义

网络分析指标用于直接测量网络的基本结构与特征,网络指标主要可以分为两类:静态指标和动态指标。根据网络的规模和层次,又可以将静态指标分为整体指标、局部指标与个体指标。从图1中可以看出,2015年以前,多数研究使用了静态网络指标来测量网络的基本结构与特征;2015年左右,研究者逐渐意识到静态的网络指标难以捕捉到开放、灵活的在线学习中的学习行为的变化,开始在学习过程的不同时间点上(如图1中以斜体形式标识的研究文献来源)测量网络的结构与特征,但这些研究仍多采用静态指标,只有少数学者开始使用动态网络指标[4,18]或者网络模拟[19](如图1中的加粗标识文献)来发现网络结构的变化趋势。

1. 静态网络分析指标

(1)静态网络整体指标

认识一个网络首先要从认识它的整体结构开始,常见的静态网络整体指标包括网络的规模、密度、直径、全局聚类系数等。一个网络的规模是指网络中行动者的个数。密度指网络中存在的关系数与所有可能的关系数的比值[27]。在Tirado-Morueta等的研究中,密度用于测量网络的凝聚力[26]。直径是指任意两个行动者之间的最大距离。全局聚类系数是局部聚类系数的平均数,该系数可以帮助研究者发现网络中的子群结构。在Gillani和Eynon的研究中,该网络的全局聚类系数为0.0009,研究者认为该网络存在子群社区,且各社区之间的联系并不紧密[1]。

(2)静态网络局部指标

网络中的连通域是指网络中没有孤立节点的子群。在连通域中,任何节点都与其他节点存在直接或间接的交互关系[9]。最大连通域是指在一个网络中拥有最大规模的子群。通过对最大连通域的考察,Skrypnyk等和Zhu等观察了网络中子群的分布情况[8-9]。

(3)静态网络个体指标

个体中心性指标可用于考察个体在网络结构中的位置和角色,分为:点度中心度、紧密中心度、间距中心度和特征向量中心度。点度中心度指网络中与某个体直接相连的关系的总数。在有向图中可以分为出度和入度:出度指该个体向其他个体发出的交互关系个数;入度指其他个体向该个体发出的交互关系个数。入度一般代表某个体在网络中的受欢迎程度,而出度代表该个体在网络中主动参与的程度[19,22]。Dawson指出,个体的社区责任感与紧密度和个体的度数存在正相关关系,而与中心性存在负相关关系[13]。紧密中心度指某个体与网络中其他个体的距离,反映了以该个体为核心的交互关系,可以代表该個体对信息的控制能力[17]。中介中心度又叫间距中心度,中介中心度高的个体又被称为网络中的“桥”,对于信息的传播非常重要。Tawfik等探究了学习者的中介中心度和点度中心度,发现大部分学习者只和另外一个而非多个学习者有过交流,论坛的互动主要依赖一小部分学习者[10]。特征向量中心度表现了某个体在网络中的重要程度[28]。

2. 动态网络分析指标

近年来,网络的动态演变过程受到了更多的重视。Zhang等在其研究中使用了四个动态网络分析指标,分别为:同质性(Homophily)、互惠性(Reciprocity)、传递性(Transitivity)和择优连续性(Preferential Attachment)[4]。同质性是指相似的行动者(性别、角色等)之间倾向于建立交流和连接。互惠性是指两个行动者倾向于进行“一来一往”的对话式交流。传递性是指若学习者A与学习者B存在交互关系,学习者B和学习者C存在交互关系,则学习者A和学习者C之间很可能会建立交互关系。择优连续性表现为“富者更富”,即处于网络中心地位或影响力较大的学习者会获得越来越多学习者的关注和交互,而一旦这些学习者退出课程,将会对论坛的交互造成较大的损害,甚至导致话题的结束。

(四)网络分析中的交互质量

大规模交互由于人数众多,在不同时间点上进行讨论,导致讨论内容难以围绕教学重点展开,交互数据噪音较多[29]。一方面,这有可能导致较低的互动水平,并进一步影响教育的干预和课程活动[30];另一方面,会对研究结果造成一定的偏差。Gilliani等在其研究中提出了“有意义的交互”(Significant Interaction)的概念。他们认为最初获取的数据是掺杂了很多“噪音”的网络,该网络需要将偶然发生的交互过滤;相反的,两个或多个行动者之间多次重复的交互才是“有意义的交互”[19]。数据的质量直接决定了交互关系的质量,网络分析中的数据筛选工作尤为重要。

为保证交互质量,对交互数据进行筛选的方式主要有四大类:按照特定论坛、帖子、小组、标签筛选;按照时间或事件筛选;按照行动者特征筛选;按照内容筛选,见表1。在对交互数据进行筛选的时候,有时候不只运用一种筛选标准或方法,而是综合使用多个标准,例如:在某一讨论区中按照学习者的特征筛选出特定的行动者[19]。

按照特定的论坛、帖子、小组、标签进行筛选,或者按照特定的时间或事件进行筛选,一般是比较粗略、简单的初步筛选办法。例如:Kellogg等选择了可能产生较多交互的讨论帖,如注册帖和专项讨论区[18];Jiang等将论坛名称和标签结合,通过标签内容,将不常使用的html标签所包含的内容去除[31]。对于特定时间的筛选,Zhang等为了排除与课程内容无关的、教师节前后的干扰,将九月二号之后的帖子剔除[4];而Manca等选择了初始熟悉系统的三周和最后活动的一周[14]。

按照行动者特征筛选主要可以分为按照网络指标筛选、按照成绩或学习行为筛选与按照角色或身份筛选。网络指标通常采用的是度数和凝聚子集,例如:Gillani等为了找到有意义的交互(Significant Interaction),采用k丛的概念,过滤掉偶然发生的交互[19];Skrypnyk等则采用最大连通域建构网络[8];Rodríguez等将度数小于2的行动者剔除[32]。有一些研究也按照成绩或学习行为进行筛选,Dawson根据学习者的学业表现筛选了学习成绩在90%以上的学生与10%以下的学生建立网络[15]。有些研究也将行动者的身份进行了限定,例如:Hernández-García等首先确定了网络中的教师角色,并将有教师参与和无教师参与的不同交互情况建立各自的网络,进行对比分析[22]。

有些研究者也会按照交互或讨论的内容进行筛选。Gillani和Eynon筛选出有关商业个案讨论的交互与围绕期末项目展开的交互[1];Tirado-Morueta等将社交类型的交互剔除后再建立网络[26]。

(五)网络分析中的研究问题

使用网络分析对在线学习的交互进行探究,提出的研究问题主要为四大类型:描述性、设计性、相关性和解释性。

1. 描述性

通常描述性研究着重对现象或特征进行描述,在其研究问题中,侧重描述现象的变化过程,如“改变(Changes)”“演变(Evolve)”,或者现象的特征,如“特点(Characteristics)”“模式(Pattern)”“本质(Nature)”“类型(Type)”“结构(Structure)”“模型(Model)”等。例如:Laat等应用社会网络分析法对学生在论坛中的交互结构进行了分析[12];Dowell等讨论了不同语言特征揭示的学生表现和社会地位[20];Tawfik等分析了MOOC课程中学习者互动随时间的变化情况[10]。在描述性研究问题中,有一类常见的研究问题是对不同对象的特征或行为进行对比。例如:Dowell等针对不同学习者的交互行为特征进行了比较[20];Dawson对学业表现较好的和学业表现欠佳的学生在社会网络分析中的指标以及网络组成进行了比较和分析[15]。

2. 设计性

设计性研究问题的表述中,通常直接出现“算法(Algorithm)”“框架(Framework)”“服务(Service)”作为设计的产物。为了更好地理解学习环境的变化,探索学习者之间的社会关系,Jiang等将论坛看作一个异质网络,基于社会网络理论提出了“跳跃—随机—游走算法”(Jump-Random-Walk Algorithm)[31]。

3. 相关性

相关性研究问题中包括对两个或多个因素之间的关系进行研究,其中有一大类为相关关系的解释。在这类研究问题的表述中,经常使用的词语有“与……有关(Relate to……)”“关系(Relationship)”等。例如:Hernández-García等将不同个体以及整体的社会网络指标与在线学习成果进行了相关分析[22];Carceller等分析了社会资本和学业成绩之间的相关关系[23];Dawson探究了社区感(Sense of Community)和网络变化之间的相关关系[13];Thormann等探究了学生助教的数量与批判性思考之间的相关关系[16];Tirado-Morueta等探究了不同的学习任务类型是否会影响个人网络指标或整体网络指标[26]。

4. 解释性

解释性研究问题主要分为因果探究型和假设驱动型。因果探究型问题的表述中通常包括表示因果的表述,如“原因(Reason)”“为什么(Why)”“影响(Influence)”“影响(Impact)”。假设驱动型的问题则会明确地提出研究假设,并通过网络演化分析对假设进行接受或拒绝。例如:在假设驱动型的研究中,Rehm等就对个人的阶层地位对于学习社区的交流类型产生的影響进行了研究[24];Zhang等则针对社会网络演化过程中是否会呈现互惠性、传递性、同质性和择优连续性等特征提出了假设并加以验证[4]。

(六)网络分析中的理论框架

这些研究常以交互模型、框架、分类与指标体系作为理论框架,对研究问题、研究方法以及研究结果的解读具有重要意义。针对不同的交互行为与交互内容,在网络分析中出现了一些较为具体的交互模型、框架、分类与指标体系。例如:Wise等提出了关于讨论内容和主题的分类指标[33];Gunawardena等则提出了五重新知识建构交互模型,将交互行为划分为了五个层次:信息的分享和比较、当知识概念以及意见产生不一致时进行的探究和发现、知识建构的协商与讨论、测试和修改提出的假设和建构、达成意见上的一致[34];Rivera等将同伴交互以及网络形成的过程划分为三种不同的机制:趋同性机制(Assortative Mechanisms)、关系性机制(Relational Mechanisms)和接近性机制(Proximity Mechanisms)[35]。趋同性机制主要依赖于行动者的同质性倾向,即行动者倾向于和其他相似的行动者进行交互,如性别、民族等[36]。关系性机制主要依赖于现有的网络结构,即行动者之间的互惠性、传递性等性质。接近性机制是指行动者位置上的临近会影响网络的形成。Soller将合作学习的对话技能和子技能划分为:主动学习(Active Learning)、对话(Conversation)和创造性冲突(Creative Conflict)[37]。主动学习包括寻求帮助以解决问题、向他人提供建议、提供正向反馈和强化。对话包括将当前任务重点转移到新的任务、促进团体的凝聚力和同伴参与度、告知同伴自己的意见或答案。创造性冲突包括对现有的观点进行正向或负向的讨论或质疑,以及推荐教师回答问题。Anderson对学生的概念化和操作化的学习层次进行了划分[38]。首先,将知识划分为事实性知识(Factual Knowledge)、概念性知识(Conceptual Knowledge)、程序性知识(Procedural Knowledge)、元认知知识(Meta-Cognitive Knowledge);然后,将认知过程划分为以下六个过程:记忆(Remember)、理解(Understand)、应用(Apply)、分析(Analyze)、评估(Evaluate)和创造(Create)。

(七)网络分析中的模型与方法

网络分析中的模型与方法主要包括社会网络分析、统计学分析、内容分析等。社会网络分析采用的模型和方法包括块建模、指数随机图模型、行动者驱动模型、传染病模型 、认知网络分析等。统计学分析经常采用的方法和模型为结构方程模型、逻辑回归、线性混合效应模型、Mann-Whitney U检验等。内容分析常使用的模型和量表包括内容分析多维度量表、商业过程挖掘、Soller内容分析模型、交互分析模型和结构语义编码。

系统科学或者系统动力学更加关注交互网络演化的规律与机制,当前使用较多的模型是SIENA和ERGM模型。SIENA可用于分析纵向网络数据,通过对效应(Effects)和协变量(Covariate)的考察,对网络可能发生的演化规律进行预测[4]。该方法基于随机行动者模型(Stochastic Actor-oriented Model,简称SAOM),将行动者看作网络中的节点,节点之间的边代表行动者之间的交互关系。模型的改变以行动者为前提,即SAOM将网络的演进看作是行动者新建、保持或者终止和其他行动者之间的边的过程,行动者有意识或者无意识的行为受网络自身的结构、行动者的特征和行为的影响。

四、讨   论

(一)网络分析中交互演化规律与机制的重要性

近年来,研究者已逐渐认识到大规模在线学习导致交互的本质发生了改变。网络分析已成为研究在线学习交互的重要理论、方法与工具,将局限于对交互关系的探索扩展到对交互关系形成的网络结构以及背后的网络演化规律与机制的研究。网络分析中静态与动态的指标,可以在不同层级上(个体、群组、整体)测量交互网络结构的特征与演化规律,是网络分析作为研究大规模交互方法与工具的重要抓手[19]。传统的SNA往往捕捉某一时间点的交互网络状态,使用一个时间点以及这一时间点之前的交互数据来构建网络。这样的网络分析往往忽略了大规模交互的动态性,特别是在以MOOCs为例的开放与灵活的学习环境中,存在大量学习者辍学、学习者随来随走的现象,使得SNA难以准确地解读在线学习交互的本质。部分研究已经意识到解释交互演化的重要性,尝试使用SNA捕捉不同时间点上网络结构的特征[8-11,25]。这与使用照相机拍照来记录发展过程类似,其实呈现的是不同时间点的静态网络,而无法将不同时间点上观察到的交互异同与交互网络结构和学习者的特征之间的关系联系起来,也就是说,难以解读与预测交互以怎样的方式进行,将发生怎样的变化,以及引起交互变化的背后到底是怎样的机制。在国际上,从网络分析的视角去发现交互演化规律与机制的研究受到了重视,是未来这一领域的发展趋势。例如:Gillani等将网络模拟的分析方法应用到在线学习交互的研究中,使用传染病模型揭示了交互网络的动态特征[19];Zhang等使用行动者模型,对社会网络演化过程中是否会呈现互惠性、传递性、同质性和择优连续性等演化规律提出了假设并进行了验证[4]。

(二)交互的演化与机制帮助我们重新认识学习的社会属性

从网络分析的视角,可以发现交互演化的新规律与机制,进而帮助我们认识在线学习的本质。已有的学习理论不乏对学习的社会性与学习的社区属性的讨论[39]。20世纪90年代已经出现了“网络化学习”的概念,用于解读学习过程中通過交互形成社交网络的过程[40]。它重点关注社交网络的建立和维系,常用于非正式学习中[41]。联通主义这一流派认为,学习最好的实现方式是建立网络,联结是有效学习的关键[42]。当学习者与其他同伴以学习为目的进行社交时,会伴随生成隐形的人际关系[5]。随着时间的推移,这些关系会逐步推动学习社区的形成。此外,社会化学习理论也关注从信息传播的视角去发现学习者如何获取信息与知识,这一流派主要关注信息传播如何受网络结构与行动者的影响,从而去发现知识生产、传播与消费的规律。可以看到,在网络环境下,学习的社会属性越来越受到人们的重视,从网络的视角去看待学习的理论层出不穷,然而这些理论的发展一直受限于实证研究的滞后,导致这些理论没有研究证据的支持与验证,难以在更大范围内传播。而网络分析特别关注网络交互的演化与机制的实证研究,能够更好地推动学习理论的演绎。从动力学的视角去认识在线学习的新规律,将开放性、灵活性与动态性等特征纳入网络分析的模型中,有助于优化现有的学习理论,也可能孕育出新的学习理论,来解释我们教育实践中产生的诸多问题,也为更好地设计未来开放与灵活的在线教育提供重要的研究支持。

(三)建立以学习交互为核心,网络分析为手段的跨学科阵营

今后的研究需要综合系统科学、统计学、教育学等不同学科的理论和方法,推动我们从网络分析的视角重新认识大规模学习中交互演化的规律与机制。多学科的融合使得我们的研究问题多样化,包括描述性、设计性、相关性、解释性等,采用的方法包括但不限于社会网络分析、内容分析和统计分析等方法,这也体现了社会网络分析和其他研究方法相结合的发展趋势。将社会网络分析和文本分析等其他方法相结合,可以更为精准地捕捉到教和学过程中的学习与交互[11],有利于更深入地了解交互内容、交互质量和小组成员的贡献程度等。更为重要的是,在多学科的交叉融合过程中,教育研究者保持清醒的头脑,以学习与交互为核心,在使用网络分析来设计教育学的研究课题时,应将如何剔除交互数据中的“噪音”作为研究设计的一部分,而非作为研究之前的纯技术层面上的数据清理工作。在大数据时代,交互数据如果不进行筛选与提纯,将是海量的,网络结构也是松散的,尽管采用了复杂的网络分析方法,往往可能得到相悖的研究结果,误导理论与实践的发展。网络分析中的交互数据筛选与提纯的工作属于教育研究中研究设计的重要部分,与问卷设计中如何设计问题与选项来获取数据、访谈中如何设计问题大纲、实验中如何选取与分组被试一样重要。研究者需要根据研究问题和研究目的进行交互数据的筛选,得到有效的交互数据,方可保证研究结论的准确性,真正发现学习与交互的新规律。

五、结   语

本研究从重新词化、基本特征、常用网络指标、数据筛选方法、研究问题、理论框架、模型与方法等多个方面,对使用网络分析方法探究在线学习交互的研究进行了分析。本研究发现,网络分析是研究在线学习大规模交互的重要方法,但传统的静态网络分析指标不足以支撑对在线学习交互展开深入研究,网络的动态演化机制将成为新的趋势和研究重点,相关实证研究亟待开展。基于多学科理论、综合多种研究方法的实证研究将帮助我们重新认识社会化学习和开放灵活的在线学习,推动社会学习理论的发展和其他理论的产生。

相关文章:

Top