查看原文
其他

高等教育数字化发展研究|方丹丹 解博超 詹逸思 韩锡斌:基于数据分析的大学生生涯选择影响因素研究

编辑部 中国教育信息化 2024-04-16

引用格式

方丹丹 解博超 詹逸思 韩锡斌.基于数据分析的大学生生涯选择影响因素研究[J].中国教育信息化,2023,29(11):064-075.DOI:10.3969/j.issn.1673-8454.2023.11.008

高等教育数字化发展研究

基于数据分析的大学生生涯选择

影响因素研究

方丹丹 解博超 詹逸思 韩锡斌

摘 要: 高校精准就业工作的基础是充分了解毕业生情况,尤其是毕业去向及影响毕业选择的因素。基于生涯决定社会学习理论,分析影响本科毕业生生涯选择的因素,构建大学毕业生生涯选择影响因素模型,为高校的精准就业服务提供决策依据。采用定量研究方法,选取E高校2020、2021、2022届5780多名本科毕业生约31.79万个数据,采用机器学习Apriori算法进行数据关联规则分析,挖掘跟生涯选择关联的因素。研究发现,籍贯、专业、课外实践成绩、专业课成绩、英语成绩、体育成绩等因素对大学毕业生的生涯选择产生影响。研究表明,高校的就业工作应关注大学生涯历程,及早关注和重视影响毕业去向的因素。大数据思维为高校精准就业工作提供数据决策,大数据方法可为高校毕业生数据分析提供一种定量研究的思路。

关键词: 生涯决定;生涯选择;机器学习;数据挖掘;影响因素

中图分类号: G434;G645

文献标志码: A

文章编号: 1673-8454(2023)11-0064-12

作者简介: 方丹丹,对外经济贸易大学信息处副处长(北京 100029),清华大学教育研究院博士研究生(北京 100084);解博超,对外经济贸易大学信息处工程师(北京 100029);詹逸思,清华大学学生学习与发展指导中心副主任、副教授(北京 100084);韩锡斌,清华大学教育研究院副院长、教授、博士生导师(北京 100084)


  近年来,受疫情和宏观经济影响,大学生就业形势严峻,教育部要求各高校要做好精准就业服务工作,各高校在引导毕业生多渠道就业、提升现代化就业服务能力等方面积极探索。精准就业服务的前提是充分了解毕业生情况和就业环境,传统的研究以量表和问卷调查的形式收集毕业生信息、就业意向,考察影响就业选择的因素。如相关学者编制的“职业决策困难调查表”[1]。彭永新和龙立荣(2001)参照国外相关学者的“职业生涯决策自我效能量表”[2],编制出“大学生职业决策自我效能量表”[3]。数字化时代,研究者开始利用学生在大学期间产生的线上数据进行研究,如使用某大学本科生的基本情况、成绩、外语水平、就业类别等信息,分析影响大学生毕业去向的因素。[4]使用个人基本情况、在校表现、就业情况等信息,分析阶层背景对大学生在校表现以及毕业去向的影响。[5]

  随着大数据技术的兴起,研究者开始关注大数据在高校毕业生就业领域的应用。有学者提出基于分布式改进随机森林算法的大规模学生就业数据分类预测模型。[6]有学者使用机器学习构建毕业生去向的预测模型。[7]已有相关文献对大数据技术在就业领域的应用进行一定的探索,鲜有研究对生涯理论和大数据技术充分融合,以及对影响因素进行考证和分析。本研究在生涯决定社会学习理论的基础上,构建大学毕业生生涯选择影响因素模型,并采用机器学习Apriori算法进行数据关联规则分析,挖掘跟生涯选择关联的因素,对模型进行验证和分析。大数据分析技术为高校就业数据分析提供一种思路和方法,助力精准就业。

一、生涯选择核心概念与相关理论

 

  (一)生涯选择的概念和内涵

  生涯选择是职业心理学领域非常重要的一个研究方向,早期的研究主要关注职业选择,1909年,“职业辅导之父”弗兰克·帕森斯(Frank Parsons)出版的第一本职业辅导专著《选择职业》(Choosing a Vacation),建立了帮助个体选择职业的概念架构,此后近半个世纪,职业辅导的理论发展都在这个框架之下进行,聚焦“职业选择”,直到唐纳德·休珀(Donald Super,1953)提出生涯发展理论,才让生涯发展的概念取代职业选择。休珀对生涯的定义是指贯穿人一生中依序发展的各种职业、工作和职位,这个定义可以扩展到职业生活的两端,包括职业前和职业后的角色,如学生和养老金领取者。[8]由此可见,生涯以职业为主轴,包括与职业有关的一切角色,生涯的选择是人一生之中连续不断选择生涯的过程。

  按照休珀的生涯发展理论,生涯选择除了职业的选择,它的内涵至少还应该包括:①生涯选择是有时间性的,是贯穿一生的发展,休珀把生涯发展分为成长、探索、确立、维持、衰退五大阶段,各个阶段不同的时间点都有不同的抉择。②生涯选择是发展变化的,生涯的发展历程是职业自我概念的发展和实践的历程。③生涯选择跟角色有关,是角色扮演和反馈学习的历程。由此可见,大学毕业生的生涯选择,必然是在大学毕业生这个角色下,各种因素相互作用、不断发展的历程。

  国内外研究者引入社会学、心理学领域相关理论,对生涯发展理论进行阐述,如约翰·霍兰(John Holland,1958)的生涯类型理论、约翰·克朗伯滋(John D. Krumboltz,1979)的生涯决定社会学习论、卡伦·泰勒和南希·贝茨(Karen M. Taylor, Nancy E. Betz, 1983)的职业决策自我效能感理论。至此掀起生涯选择、生涯决定、生涯决策等理论与研究的热潮。

  (二)生涯决定社会学习理论

  克朗伯滋的生涯决定社会学习论(the social learning theory of career decision making),从心理学和社会学角度解释影响个人生涯选择的因素,并强调不同因素之间的交互作用。克朗伯滋把影响一个人生涯决定的因素分为四类:一是遗传因素和特殊能力,遗传因素包括种族、性别、外貌等,特殊能力包括智力、艺术能力、协调能力等。二是环境的情况和事件,这些外在环境因素,非个人所能控制,主要包括家庭的影响、社会组织的改变、科技的发展、自然资源的开发、工作机会的数量和性质、训练机会的数量和性质、不同职业的报酬等。三是学习经验,每个人独特的学习经验,对其生涯选择的影响非常重要且复杂。四是工作取向的技能,前三种因素以一种交互影响的方式锻炼出个人特具的工作取向的技能,包括解决问题的能力、工作习性、工作或作为的标准和价值、情绪反应、知觉和认知的历程等。[9]

  生涯决定社会学习理论为生涯选择过程中的影响因素进行全面且清楚的分类和描述,为后来的研究者对生涯选择影响因素的研究提供很好的思路。该理论不仅强调遗传因素,也强调社会因素的作用,且该理论提出的学习经验在生涯选择中的作用,强调生涯选择不仅仅是个人特质与角色特质相匹配的过程,还要不断拓展学习经验,并从中探索生涯活动。在研究个人内在因素和外在社会因素对生涯选择影响的实证研究中,给出一种研究的范式。

  (三)生涯选择影响因素文献综述

  自休珀之后,对生涯选择的研究,成为生涯领域研究者关注的主题,尤其是对生涯选择影响因素的研究,陈迎明对已有文献进行分析,将这些因素概括为内部因素和外部因素,根据劳动准备阶段的内涵将个人因素、学校因素划分为内部因素,家庭因素、社会因素归为外部因素。[10]其中,个人因素包括专业知识、学历层次、工作经历、在校学习情况、就业观念、就业能力、身份、性别、生源地等方面;学校因素包括学科专业、教学内容与教学组织、学校层次与地理位置、学校就业指导工作等方面;社会因素包括经济发展状况、社会资本、人力资本、政策与法律法规、求职歧视现象、社会媒体舆论导向等方面;家庭因素包括家庭社会关系、家庭背景两个方面。有学者通过Logistic回归分析,发现性别、户籍、家庭经济状况、学校类型、学校层次、学科类型、学科层次、个人学历、学业成绩、创业意愿等变量在不同类别间对就业的影响存在显著差异。[11]对外部因素的探讨包括家庭因素、社会因素,家庭因素主要聚焦家庭社会经济地位、父母的社会地位与社会资本。岳昌君、周丽萍认为来自高收入、父母有文化、社会关系广泛家庭的毕业生就业机会多,并且工作收入水平也高。[21]社会因素聚焦社会资本、经济发展和人才结构,黎大志、姜新生认为经济发展水平、人才在地区间的结构分布、高校专业设置与社会需求间的结构性矛盾是影响大学生就业的非常重要的因素。[22]大部分的实证研究更加关注个人因素,例如,有学者从学生个体特征的角度探讨学生就业与学生个体特征的关联度,研究发现大学生的专业知识、实践能力等自身综合素质是大学生实现就业的关键因素,然后是专业因素和性别因素。[12]

  随着人工智能和大数据技术的兴起,给生涯选择的研究带来新的机遇和挑战。目前,研究者开始关注人工智能和大数据在生涯领域的应用,孙怡帆(2019)使用机器学习构建毕业生去向的预测模型,该研究发现,性别、院系、来源地、高中文理科、高考成绩、大学期间学习成绩等因素对大学生毕业去向的预测有重要作用。[7]有学者通过分析4634名学生的行为数据预测学生的职业选择,行为数据主要是通过校园智能卡收集的图书馆记录、宿舍出入、校园消费、图书借阅等数据。[13]有学者使用机器学习技术eXtreme Gradient Boosting(基于提升树的加法模型,简称XGBoost)对18,000名毕业生在大学期间的教育信息和职业选择信息进行分析,预测大学生的职业选择。[14]有学者使用机构数据和社交媒体新闻,预测学生的职业决策。[15]有学者提出一个使用机器学习和人工智能技术为学生提供职业咨询的框架,基于机器学习的White Box和Black Box模型分析学术和就业能力等教育数据,来预测学生的职业选择。[16]

  此类研究利用已有数据挖掘不同影响因素和就业选择之间的关系:一方面在因素的选择上,仅根据个人经验或以往诸如家庭背景对毕业去向的影响的单个研究,缺乏整体性理论依据。另一方面,因获取数据的限制,缺少学生家庭背景、社会就业环境等信息,作为预测类研究,精确性有待商榷。然而,在控制住外部因素的情况下,挖掘毕业去向和各内部因素之间的关系,具有一定的研究价值和意义。此外,基于大数据技术对生涯选择进行研究需要生涯规划领域的研究者和计算机领域专家一起才能完成,计算机领域和生涯领域的跨学科研究,将是生涯选择研究的未来趋势。

二、生涯选择的内部影响因素模型构建

   

  基于以上分析提出本文研究问题:一是大学生生涯选择受哪些内部因素的影响?二是这些因素跟生涯的选择之间是否存在一定的规律?

  先厘清生涯选择与毕业去向的关系,生涯选择是生涯发展领域的重要概念,其概念和内涵揭示生涯选择是一种相互历程,不仅反映个人自主选择的结果,也反映社会所提供的机会和要求。毕业去向就是这样一种相互作用的结果,它是实践领域的概念,是我国高校就业工作的重要指标,主要包括升学、出国、就业、自主创业等几种类型。大学生毕业去向的选择就是在当下时间点选择一种生涯方向,选择哪种生涯方向,是由一组复杂的因素交织互动而形成的结果,这些因素包括个人的遗传因素、环境的各种事件以及各种学习经验。[17]因此,本研究把毕业去向作为大学生毕业时的生涯选择的结果,来考察哪些因素影响这种选择结果。

  理论层面,生涯决定社会学习论认为影响一个人生涯决定的因素包括:种族、性别、外貌等遗传因素,智力、艺术能力、协调能力等特殊能力,家庭的影响、社会组织的改变、科技的发展、自然资源的开发、工作机会的数量和性质、训练机会的数量和性质、不同职业的报酬等环境因素,学习经验和工作取向的技能。[9]

  现有文献研究中,对个人遗传因素的探讨主要集中在民族、性别、籍贯。高岳涵认为少数民族大学生就业较之汉族学生具有特殊性,传统文化与家庭对少数民族女大学生就业有“制约”作用。[18]有学者实证研究表明男生就业的机会大约比女生高20%。[19]有学者认为,男生就业的发生概率是同等条件下女生的0.745倍,生源地为东部地区的毕业生就业状况要远远好于生源地为中部和西部地区的毕业生,而中部地区又好于西部地区。[20]学校因素的研究涉及学科专业、学校层次及其地理位置等方面,黄敬宝认为,学科专业对就业机会有特别强的影响,就业机会从高到低依次为管理学、经济学、文学、法学。[23]谢维和认为高等教育的层次结构、标准化程度、证书制度影响高等学校学生就业。[24]在校学习情况对就业影响的研究主要包括学习成绩、英语四六级成绩、奖学金、论文发表、课外实践、工作实习等方面,李炜、岳昌君通过实证研究表明,学习成绩、是否获得证书、是否党员、是否学生干部、工作实习等个人素质是决定求职成败和收入水平的关键因素,专业学习优秀、外语水平好的毕业生更容易找到工作。[25]有学者通过实证研究发现毕业生在学校期间参与过就业社会实践有助于显著提高其毕业后去东北、中部与西部就业的概率。[26]

  本研究选择的研究范畴为内部因素,基于以上理论和文献分析,确定本研究的自变量。内部影响因素包括个人因素和学校因素:个人因素包括遗传因素和学习经验,遗传因素指民族、性别、籍贯,学习经验指英语成绩、专业成绩、体育成绩、学业预警、课外实践等;学校因素指院系和专业。本研究范畴的大学毕业生生涯选择的内部影响因素模型如图1所示。

图1 大学生生涯选择的内部影响因素

  以上影响因素中,是否确实影响大学生生涯选择?各个因素与生涯选择之间是否存在一定的规律?规律是什么?本研究以毕业生的毕业去向数据作为生涯选择的因变量,基于以上影响因素模型,选择自变量,采用大数据技术,对大学生的毕业去向数据进行数据挖掘,分析探讨毕业去向与大学生的以上因素之间的关联关系。

三、研究设计

 

  (一)数据收集与预处理

  本研究选择E高校2020、2021、2022届这三年的毕业生数据作为样本,经过预处理,删除空值后,样本包含5780多名学生的数据,共处理约31.79万个数据。

  1.因变量

  本研究的因变量为毕业生的毕业去向,分为“用人单位接收”“升学”“出国(境)”“创业”和“待就业”五大类。因为“待就业”人数特别少,且为不确定情况,因此本研究不对这类进行分析。“用人单位接收”定义为狭义的“就业”,“出国(境)”以下简称“出国”,因此,本研究的因变量定义为就业、升学、出国、创业四类。

  2.自变量

  基于本研究确定的大学校园环境下的生涯选择的内部影响因素模型,结合实际的数据基础,选择自变量包括性别、民族、籍贯、院系、专业、专业成绩、体育成绩、英语成绩、课外实践、学业预警。此外,为了数据的集中性,对分类太细的数据进一步归类,其中,籍贯转换为籍贯区域,专业转换为专业类别。

  连接毕业生就业信息数据库、基本信息数据库、学业成绩库、四六级成绩表、课外实践数据库、体育成绩数据库,对数据进行整合、删除空值、去重、离散化、脱敏等预处理,得到数据样本,描述如表1所示。

表1 样本描述

  (二)算法选择

  本研究选择Apriori算法进行数据挖掘。Apriori算法是一种为布尔关联规则挖掘频繁项集的算法,最初是针对购物篮分析问题提出的,其目的是发现交易数据库中不同商品之间的联系规则。该算法比较符合本研究的问题,可以挖掘出样本数据中出现较频繁的因素以及因素之间的关联规则,从而找到同样生涯选择方向的学生共性。

  Apriori算法使用一种逐层搜索的迭代方法,k项集用于搜索(k+1)项集。首先,找出所有频繁1项集的集合L1;其次,用L1生成候选2项集的集合C2;最后,通过探查候选2项集的集合来形成频繁2项集的集合L2。以此类推,使用L2寻找L3。如此迭代,直至不能找到频繁k项集为止。支持度和置信度是Apriori算法的两个重要指标。支持度是指在所有项集中{X,Y}出现的可能性,即项集中同时含有X和Y的概率:support(X→Y)=P(X,Y)。该指标作为关联规则有用性的度量标准,衡量所考察关联规则在“量”上的多少。置信度表示在关联规则的先决条件X发生的情况下,关联结果Y发生的概率,即含有X的项集中,同时含有Y的可能性:confidence(X→Y)=P(Y│X)=P(X,Y)/P(X)。类似地,需要设置置信度最小阈值(mincon,Minimum Confidence)来进一步筛选,最终生成满足需要的关联规则,即:confidence(X→Y)≥mincon。

四、数据分析

 

  采用Apriori算法挖掘关联规则,分析其生涯选择的影响因素。编程语言选择python,集成开发环境选择pycharm。根据数据的特征,有学业预警的学生人数仅占3%左右,若采用Apriori算法寻找频繁项,几乎所有的频繁项都会出现无学业预警,对数据挖掘有干扰且无意义,因此,本文认为学业预警对毕业去向影响可忽略不计。

  (一)不同生涯选择的学生特征分析

  按照就业、升学、出国、创业对毕业生数据进行分类,分别寻找频繁项目集,最小支持度选择0.3,最小置信度选择0.9,得到频繁项集,分别列为频繁1项集的集合L1,频繁2项集的集合L2,频繁3项集的集合L3

  由计算结果发现,所有频繁项集里都出现女生和汉族,分析样本数据,发现该高校女生占比70%左右,汉族学生占比80%,不能代表频繁项,因此以下分析去掉这两项。按照毕业去向和项集分类整理如表2所示。

表2 频繁项集

  由表2可发现,支持度跟样本数据集的特征非常相关,如样本数据集里,专业成绩数据中,“良”占比64.5%,占比大的数据,支持度会显著高。因此,解决这一问题的办法是结合每个项在整个样本数据中的占比来分析,由1项集L1支持度及各项在全部样本数据中的占比进行对比分析,结果如表3所示。

表3 在样本数据中的占比

  筛选出支持度高于占比的频繁项,得到结果如表4所示。

表4 有效频繁项

  由表3和表4的频繁项分析结果可知:①毕业去向为就业的学生中,专业成绩和体育成绩都表现良好、属于第二梯队的等级,英语成绩仅为及格,属于排名靠后的成绩,课外实践活动中表现优秀,专业类别为管理学的学生较多。②毕业去向为升学的学生中,专业成绩和英语成绩都是优秀,专业排名和英语成绩排名靠前的学生较多,课外实践活动表现也很出色,此外,专业类别为经济学的比例较高。③毕业去向为出国的学生中,专业成绩和平均成绩都是良好,专业类别为经济学的比例较高。④毕业后选择自主创业的学生中,体育成绩良好,专业成绩中等,英语成绩仅为及格,国际经济贸易学院的学生占比较大,专业类别大部分为经济学。

  置信度计算结果如表5所示。

表5 置信度

  关联规则表示两个项之间的关联度,强关联的项一般会同时发生,由表5可知,无论学生的毕业去向是就业、升学还是出国,表现出较为一致的关联规则:①专业课成绩、平均成绩、体育课成绩关联性较强,只要有一项成绩等级为良好,则其它两项成绩等级也大概率为良好。②课外实践表现优秀的学生,在专业成绩、平均成绩上的表现也是良好。③创业的学生中,关联规则的置信度为1,有非常强的关联性,创业学生样本相对较少,比较容易出现强关联规则,如专业成绩、体育成绩同时良好的情况下,平均成绩一定是良好的可能性更高。另外,由于该校国际经济贸易学校的所有专业均为经济学,因此这两个变量也出现值为1的强关联。

  (二)学生生涯选择倾向分析

  以上研究结论,是生涯选择去向的学生特征描绘,但是否可以得出学生的选择倾向呢?是否可以认为专业成绩优秀的学生更倾向于选择升学?本研究认为,这是不同维度的数据分析,需重新进行计算和分析。基于前面的结论,分别计算原有频繁项下不同毕业去向的概率,计算结果如表6所示。

表6 频繁项下不同毕业去向的概率

  表6进行横向和纵向对比,可发现:①总样本数据中,选择就业和升学的人数相当,分别占比35.1%和34.7%,选择出国的人数占比27.7%,创业人数最少,约为2.4%。②大部分情况下,就业、升学、出国、创业的人数占比都与总样本呈现的比例相当,如专业成绩良好的学生中,就业占36.3%、升学占31.6%、出国占30.1%、创业占2%。与总样本中的占比较为接近。③专业成绩上出现特异值,专业成绩优秀的学生中,70.9%的人选择升学,说明专业课成绩好的学生考上研究生的比例非常高。而剩下的30%学生中,22.7%选择出国,仅6.3%的学生直接就业,0.1%的学生选择创业。④英语成绩上也出现特异值,英语成绩优秀的学生中,近一半(46.9%)的学生升学,34.8%的学生出国,远远高于在总样本量下的占比。⑤从学生专业来看,管理学和经济学出现高于在总样本量下的占比,管理学的学生中,近一半(47.4%)的学生直接就业。经济学的学生中,升学和出国的比例略高。⑥体育成绩优秀的学生中,升学和出国的占比高于在总样本量下的占比,分别是44.3%和33%。

五、研究结论及建议

 

  本研究利用机器学习的Apriori算法挖掘出不同生涯选择的学生的共同特征,并分析每个特征下的所有学生选择不同生涯的占比,从两个维度进行数据分析,主要研究结果及建议体现在以下方面。

  1.专业成绩影响生涯选择。生涯选择为升学的学生中,专业成绩优秀的学生占比相对较高,而专业成绩优秀的学生中,大部分(70.9%)选择升学。选择就业的学生大部分(87.4%)专业成绩良好,专业成绩良好的学生更倾向于选择直接就业或出国。大学生本科期间的专业成绩代表学生的专业能力和学习能力,直接影响学生是继续读研还是会直接就业。专业成绩最优秀的学生大多数会选择继续读研,且考上研究生的学生大多数专业成绩优秀。专业成绩良好的学生直接就业或出国的概率更大。因此,如果想要本科毕业时继续读研,大学期间须努力学习,专业课程取得优秀的成绩。

  2.英语成绩影响生涯选择。选择升学的毕业生中,英语成绩优秀的比例较高,且英语成绩优秀的学生中,近一半(46.9%)选择升学,然后是34.8%选择出国。大学生选择本科毕业时出国,大多数是到国外进行深造,跟国内升学一样,英语成绩是必要条件,因此,如果以升学或出国深造为目标的学生,须在英语学科上取得优异的成绩。

  3.体育成绩影响生涯选择。选择就业和创业的毕业生中,都出现体育成绩良好的特征,而那些体育成绩优秀的毕业生,近一半(44.3%)选择升学,33%选择出国。一方面,继续深造的本科毕业生,一般是学习成绩好、学习能力强、自觉性较好、自我要求也较高的学生,在体育方面,也会取得比较好的成绩;另一方面,继续读研抑或出国深造,需有健康的体魄,爱好运动、劳逸结合,才能有足够的精力完成学业。

  5.学生的专业对生涯选择有影响。本研究样本数据中发现,管理学的毕业生选择就业的占比更大,经济学的毕业生更倾向于升学和出国。而创业的学生中,一半以上(58.9%)是经济学专业的。从专业本身的发展、就业需要、就业前景来看,不同的专业存在差异。因此,不同专业的学生应根据本专业的具体情况、就业前景、升学比例,综合评判,尽早确定生涯选择方向,并进行相应的规划。

  6.是否常参加课外实践活动,与生涯选择有一定的关联,就业和升学的毕业生中,均有一半以上课外实践获得优秀的成绩。大学的课外实践活动,主要是为了积累对社会认识的阅历,在实践过程中锻炼能力、开拓视野,为以后的工作做好准备。如果以就业为目标的大学生,对参加课外实践活动更加积极;以升学为目标的大学生,为了积累学分,拿到综合优秀的成绩,也会积极参加课外实践。而以出国深造为目标的大学生,课外实践活动的吸引力则较弱,有部分学生不积极参加课外实践,只求达到培养方案的基本要求即可。因此,课外实践活动应该从学生需求出发,设计更加丰富多元的课外实践活动,尤其注意满足出国学生的需求。

六、研究价值与不足之处

 

  本研究选择E高校2020、2021、2022共三届毕业生数据进行分析,针对就业、升学、出国、创业四类毕业去向,分别采用机器学习的Apriori算法挖掘关联规则,分析其生涯选择的影响因素。研究的理论价值:一是构建了大学生生涯选择的内部影响因素模型,对比已有研究,本研究聚焦大学校园里产生的客观因素,未考虑外部环境因素和个人主观因素,虽然未考量所有因素,但研究结论更具有针对性、可靠性和实用性;二是本研究以大数据分析技术,为生涯选择研究提供一种定量研究的思路。研究的实践意义:一是将大数据思维融入高校精准就业工作中,以大数据技术为手段,为高校就业工作提供数据决策;二是以生涯发展的理论观点来看大学生的毕业选择,高校的就业工作应关注大学生生涯历程,而不仅仅是毕业季,就业部门应鼓励大学生尽快确定自己的生涯目标,就业部门还应提供数据给学生参考,让学生能够明确自己的努力方向。

  本研究不足之处是数据的局限性:一方面,由于个案研究中样本数据的局限性,导致难以覆盖研究问题下的所有样本可能,虽然研究结论仍具有一定的代表性和可供参考的价值,其他高校可参考本研究方法对本校毕业生数据进行分析,但若能同时获得多所不同层次高校数据,亦可采用本研究的方法进一步深入研究。另一方面,自变量的选择存在片面性,未来的研究,可以通过调查问卷的方式,加入学生的家庭背景、主观意愿、特殊事件等方面的数据,获得更加全面的研究结论。



参考文献:


  [1]GATI I, KRAUSZ M, OSIPOW S H. A taxonomy of difficulties in career decision making[J]. Journal of Counseling Psychology, 1996,43(4):510.

  [2]BETZ N E, KLEIN K L, TAYLOR K M. Evaluation of a short form of the career decision-making self-efficacy scale[J]. Journal of Career Assessment, 1996,4(1):47-57.

  [3]彭永新,龙立荣.大学生职业决策自我效能测评的研究[J].应用心理学, 2001(2):38-43.

  [4]林曾,蔡蔚萍.影响本科生毕业去向的因素——基于W大学2014届本科毕业生的实证分析[J].江汉论坛,2016,460(10):128-134.

  [5]李梦竹.阶层背景对大学生在校表现及毕业去向的影响研究[J].当代教育科学, 2018(6):88-92.

  [6]乔非,葛彦昊,孔维畅.基于MapReduce的分布式改进随机森林学生就业数据分类模型研究[J].系统工程理论与实践,2017,37(5):1383-1392.

  [7]孙怡帆,潘昆峰,孙正阳,等.大学生毕业去向预测的思路与方法——基于机器学习算法的尝试[J].教育学术月刊,2019,318(1):25-35.

  [8]SUPER D E. A developmental approach to vocational guidance: recent theory and results[J]. Vocational Guidance Quarterly, 1964,13(1):1-10.

  [9]MITCHELL A M, JONES G B, KRUMBOLTZ J D. Social learning and career decision making[M]. Carroll Press, 1979.

  [10]陈迎明.影响大学生就业因素研究十年回顾:2003—2013——基于CNKI核心期刊文献的分析[J].现代大学教育,2013,142(4):35-44.

  [11]李涛,孙煖,邬志辉.2021年疫情背景下中国高校应届毕业生就业状况有何变化?——一项基于2021年和2020年全国调查数据的实证研究[J].华东师范大学学报(教育科学版),  2022,40(2):100-113.

  [12]陈德良,邓德胜,刘永红.大学毕业生就业影响因素的关联规则挖掘[J].教育与职业, 2012,741(29):87-88.

  [13]NIE M, XIONG Z, ZHONG R, et al. Career choice prediction based on campus big data-mining the potential behavior of college students[J]. Applied Sciences, 2020,10(8):2841.

  [14]WANG Y, YANG L, WU J, et al. Mining campus big data: prediction of career choice using interpretable machine learning method[J]. Mathematics, 2022,10(8):1289.

  [15]YANG T C, CHANG C Y. Using institutional data and messages on social media to predict the career decisions of university students-a data-driven approach[J]. Education and Information Technologies, 2023,28(1):1117-1139.

  [16]GULERIA P, SOOD M. Explainable AI and machine learning: performance evaluation and explainability of classifiers on educational data mining inspired career counseling[J]. Education and Information Technologies, 2023,28(1):1081-1116.

  [17]金树人.生涯咨询与辅导[M].北京:高等教育出版社, 2007.

  [18]高岳涵.西北少数民族大学生就业影响因素的性别差异化研究[J].西北师大学报(社会科学版),2016,53(3):118-123.

  [19]胡永远,余素梅.大学毕业生就业机会比率的性别差异研究[J].大学教育科学, 2011,125(1):88-91.

  [20]刘小瑜,胡军刚.基于回归模型的大学毕业生就业影响因素实证分析[J].江西财经大学学报,2008,56(2):115-120.

  [21]岳昌君,周丽萍.经济新常态与高校毕业生就业特点——基于2015年全国高校毕业生抽样调查数据的实证分析[J].北京大学教育评论,2016,14(2):63-80,189.

  [22]黎大志,姜新生.困境与出路:大学生就业问题的理性思考[J].现代大学教育,2009,119(5):77-80.

  [23]黄敬宝.大学生就业机会的影响因素[J].经济导刊, 2011,159(10):18-19.

  [24]谢维和.分层、标准化与证书——高等教育内部影响毕业生就业的因素分析[J].中国高等教育,2004(8):25-27.

  [25]李炜,岳昌君.2007年高校毕业生就业影响因素分析[J].清华大学教育研究,2009,30(1):88-95.

  [26]李锋亮,王磊,李曼丽.就业社会实践与毕业生去重点地区就业[J].大学教育科学, 2011,129(5):98-102.


 Research on the Factors Influencing College Students’ Career Choices Based on Data Analysis

Dandan FANG1,2, Bochao XIE1, Yisi ZHAN3, Xibin HAN2

(1.Network Security and Information Office, University of International Business and Economics, Beijing 100029;

2.Institute of Education, Tsinghua University, Beijing 100084;

3.The Center for Student Learning and Development, Tsinghua University, Beijing 100084)


Abstract: The basis of accurate employment work in colleges and universities is to fully understand the situation of graduates, especially the graduation destination and factors affecting graduation choices. Based on the social learning theory of career decision making, this paper analyzes the factors that influence the career decision of graduates, and constructs a model of the factors affecting the career choice of college graduates, providing decision-making basis for precise employment services in colleges and universities. The paper adopts quantitative research methods. The machine learning Apriori algorithm is used to analyze the data of a university graduate, select more than 317,900 data from over 5780 graduates of E college in 2020, 2021, and 2022 to analyze the data association rules, and to mine the factors associated with career choice. The research found that factors such as native place, major, extracurricular practice achievement, professional course achievement, English achievement and sports achievement have an influence on the career choice of graduates. Research has shown that employment work in colleges and universities should focus on the career history of college students, and pay early attention to and emphasize the factors affecting graduation destinations. Big data thinking can provide data decision-making for precise employment work in universities. Big data methods can provide a quantitative research approach for data analysis of college graduates.
Keywords: Career decisions; Career choices; Machine learning; Data mining; Influencing factors

编辑:王天鹏   校对:王晓明


往期目录|超链接版

《中国教育信息化》2023年第10期


《中国教育信息化》2023年第9期


《中国教育信息化》2023年第8期


《中国教育信息化》2023年第7期


《中国教育信息化》2023年第6期


《中国教育信息化》2023年第5期


《中国教育信息化》2023年第4期


《中国教育信息化》2023年第3期


《中国教育信息化》2023年第2期


《中国教育信息化》2023年第1期





点击此处 在线投稿



期刊简介

《中国教育信息化》创刊于1995年8月,是由中华人民共和国教育部主管,教育部教育管理信息中心主办,面向国内外公开发行的国家级学术期刊。期刊内容力求全面深入地记录我国教育信息化的建设进展、研究与应用成果和行业发展状况,开展我国教育信息化发展状况调研和教育信息化国际比较研究,服务于国家教育宏观决策;力求全面准确地把握教育信息化相关的方针政策和标准规范,及时追踪ICT前沿技术的发展趋势及其与教育的融合,深度挖掘教育信息化建设与应用的体制、机制创新,服务于我国教育信息化实践。


●RCCSE中国核心学术期刊

●中国人文社会科学(AMI)扩展期刊

●中国期刊全文数据库收录期刊

●中文科技期刊数据库收录期刊

●国家哲学社会科学学术期刊数据库收录期刊

●中国核心期刊(遴选)数据库收录期刊

●龙源期刊网收录期刊


一年12期,每月20日出版

20元 / 期,邮发代号:82-761

编辑部邮箱:mis@moe.edu.cn

通讯地址:北京市西城区华远北街2号921室



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存