推荐星级:
- 1
- 2
- 3
- 4
- 5
Python在学院招生数据分析中的应用*
资料介绍
在大数据的今天,Python丰富的工具包在科学计算、文件处理、数据可视化等领域越来越凸显其价值。使用Python对学院招生的生源地信息数据进行筛选,清洗,统计、分析得到可视化图像数据。通过这些数据,采用算法对下一年学院招生数进行预测,给招生管理提供数据支持,也为学院长远的招生规划提供参考。
部分文件列表
文件名 | 大小 |
Python在学院招生数据分析中的应用*.pdf | 2M |
部分页面预览
(完整内容请下载后查看)Computer Era No. 11 2018
· 102 ·
DOI:10.16644/j.cnki.cn33-1094/tp.2018.11.029
Python在学院招生数据分析中的应用*
叶惠仙
(福建农业职业技术学院,福建 福州 350007)
摘
要:在大数据的今天,Python 丰富的工具包在科学计算、文件处理、数据可视化等领域越来越凸显其价值。使用
Python对学院招生的生源地信息数据进行筛选,清洗,统计、分析得到可视化图像数据。通过这些数据,采用算法对下一
年学院招生数进行预测,给招生管理提供数据支持,也为学院长远的招生规划提供参考。
关键词:Python;招生;生源地;算法;行为预测
中图分类号:TP393
文献标志码:A
文章编号:1006-8228(2018)11-102-05
Application of Python in the analysis of college admissions data
Ye Huixian
(Fujian Agricultural Vocational and Technical College, Fuzhou, Fujian 350007, China)
Abstract: In big data's today, Python's rich toolkits are increasingly highlighting their value in areas such as scientific
computing, file processing, and data visualization. Use Python to filter, clean, statistical, and analyze the data of the students'
enrollment information to obtain visual image data. With these data, algorithm is used to predict the number of college
enrollment in the next year, providing data support for enrollment management, and also providing reference for the college's
long-term enrollment plan.
Key words:Python;enrollment;student source;algorithm;behavior prediction
数据的重要应用领域,研究大数据应用与教育领域的
0 引言
深度融合,是我国教育发展的现实需求和未来趋势。
Python是目前市面上用于大数据分析的优先选择,
Python 数据分析功能强大、全面,从数据抽取、收集整
理、分析挖掘及展示,都可以在同一种 Python里实现,
避免了开发程序的切换,Python 的数据挖掘能力和产
品构建能力兼而有之,是跨平台且开源的技术、成本又
小。南大教育基金会通过数据分析出被受资助的学生
对像,就直接将补款打入学生餐卡,而学生无需填表,
不用审核,而避免了“假”贫困生;Knewton利用大数据
分析来帮助学生设计个性化课程,让课程和教科书能
够适应每个学生的差异,学生可以按照自己的节奏来
控制学习进度,面不受到周围其他学生的行业影响[1]。
大数据正在成为促进组织创新、产业升级和经济
发展的强大驱动力。其中,教育领域被认为是一个大
1 Python在数据分析中的应用
数 据 时 代 ,通 过 数 据 分 析 挖 掘 数 据 的 价 值 ,
Pythony 就是很好的选择,它包含了 Numpy、Pandas、
Matplotlib、Scipy 、Ipython等主要数据分析库,当掌握
并熟悉了这些数据分析库的使用方法后,对于一个几
千万行的 csv 数据的处理用 Pandas 只需要不到十秒,
而且使用的代码行更少[2]。大数据技术将要做的数据
及面临的问题定义为测量、收集、分析和报告,从而对
招生资源以及安排力度进行重新调整,对历年在招生
过程中产生的海量数据进行解释和分析,以评估学院
进展,预测未来表现,发现潜在的问题,大数据实质上
是对应用者在应用过程中所产生的海量数据进行系
收稿日期:2018-08-28
*基金项目:福建省教育厅中青年教师教育科研项目科技类(JAT170997)
作者简介:叶惠仙(1978-),女,福建省南平人,硕士,副教授,现任计算机专业教师,主要研究方向:计算机网络技术,大数据。
计算机时代 2018 年 第 11期
· 103 ·
统性的分析,以实现掌握规律及预测行为表现的目的。 年所有入学新生相关数据进行分析,并从中发现规律
本文采用的技术路线如图1所示。
并找到有用的信息,用来掌握本院的招生宣传方式的
侧重点。表1为我省2010年—2018年高考考生数。
表1 近年来福建高考考生数据
年份 2018年 2017年 2016年 2015年 2014年 2013年 2012年 2011年 2010年
福建
20.09万 18.82万 17.5万 18.93万 25.5万 26.6万 25.0万 26.7万 27.8万
考生
图1 技术路线
本文基于 python 的学院招生生源地大数据分析
—以福建农业职业技术学院为例,在学院历年招生
信息数据中,使用 Python 工具作为数据分析与挖掘
软件,分析学生报到的高考生源地各地区报名情况,
把生源地形成图例进行对比与分析。
2 基于python的学院招生生源地大数据分析
伴随近 8 年来全国高考报名人数总体的下降,录
取规模的持续增加,录取率呈快速增长态势,随着高
校录取率的不断提高,延缓了高考参与人数下降的造
成的影响,录取率是有上线的,从 2020 年开始每年
100%的入学率,也很难再保持每年700万以上的大学
毕业生数量了。那么也就意味着学校招生供应总量
也会很快下降,以后不仅社会招生难度在加大,学校
招生也会进入到白热化。未来10年,对生源的争夺会
愈演愈烈,所以要对生源地数据分析提前布局,了解
我院生源分布情况,在提高学院自身的办学水平的同
时开展长远的招生规划[3]。
2.1 用python来做我校招生数据的科学分析
在众多的数据中,python 提供了功能强大的三大
模块:Numpy、Pandas 以及 Matplotlib。numpy 提供了
多维数组对象 ndarray,能直接对数组执行数学和元
素级别的运算;Pandas 主要提供快速便捷地处理结构
化数据的大量数据结构和函数。matplotlib 用于绘制
数据图表,ipython能够极大提高python的编程速度,
还用于交互式数据处理。Scipy 内有用于解决科学计
算 中 各 种 标 准 问 题 域 的 各 种 包 [4],本 文 用 到 的 是
ipython 的 Jupyter Notebook 作为 IDE。提取出所需的
数据,并将它可视化。
当前福建省高考生源正也呈现下降的趋势如表1
所示。家长和考生都更加倾向于知名度高的名牌高
校,高校尤其是农林院校之间的生源竞争正在日趋白
热化,招生工作面临着各种各样的挑战,学生的个性
化选择与高校传统专业设置之间的不匹配导致很多
专业无人问津,学生录取后不报到的现象日益严重。
如何在这场巨大的、彻底的、颠覆性的变革中有效地
利用大数据发掘招生数据的相关性,寻找到招生的新
途径,使高校招生工作更具有实效性与科学性。现对
我院 2010、2011、2012、2013、2014、2015、2016、2017
2.1.1 读取我校原始数据
如图 2 为我校招生原始的 EXCEL 格式的一部分
数据,对我校自 2010 年至 2017 年在福建省各城市及
省外的招生人数、各年招生总人数进行读取。首先导
入matplotlib、pandas、numpy模块,读取数据代码,代码
如下:
图2 我校招生示例数据
全部评论(0)