【摘要】为了观察进入MBA 前后的工资差异及影响关系,给继续学习深造提供理论依据,采集了60 个美国著名商学院的数据为试材进行模式识别分析。该试验所用数据来源于美国某著名商学院,包含GMAT 分数,学费,进入MBA 前后的工资等变量。
笔者通过测定60 名学生进入MBA 前后的工资状况,GMAT 分数,学费之间的关系,采用散点图和盒形图等数据描述方法,回归分析等数据分析方法建立并验证模型拟合程度。由线性回归模型根据自身情况对就业前景进行合理估计,从而为是否继续进入MBA深造提供理论依据。
【关键词】方差分析,回归模型,MBA 深造,薪资状况自上世纪80 年代开始,数据挖掘逐渐开始在中国起步,即,通过数据统计、整理及分析,寻找数据中隐藏的有用的信息,为决策分析做出指导。国内关于数据分析的研究已经覆盖商业、工业等各个领域。文章的结果是定量给出“学费”、“进入MBA 前的工资”和“GMAT 分数”对MBA 毕业生年薪的影响,也希望给有志于攻读MBA 的学生一点考虑和选择的方式。
第1 章 数据采集
本文从美国《BUSINESS WEEK》所评选出的美国MBA
排行榜中选出排名前60 位的商学院的MBA 毕业生的加权年薪(WS)、分数(GMAT)、进入MBA 前的工资(PS)的数据。又从《金融时报》上获得其每年的学费(AT)做散点图可知均十分显著。利用这些数据,建立数学模型,进行比较分析。表1-1 即是数据分析及模型建立所用部分数据。
表1-1 60 所商学院的MBA 毕业生数据
第2 章 选择变量
2.1 变量的选择
“学费”、“进入MBA 前的工资”和“GMAT 分数”等因素对MBA 毕业生的年薪的影响程度可以表示为:
Y=f(X1,X2,X3,……Xn)其中Y 为反映年薪波动指标,Xi 为第i 个影响因素的取值。
由于MBA 毕业生的年薪受社会经济景气与否,社会对毕业生的认可程度,毕业生个人的努力程度、个人机遇、人际关系网络、学校知名度、学费、在校GMAT 分数等诸多因素的影响,所以当我们以加权年薪作为因变量时,自变量应当从以上几个指标中选取。进一步分析,经济景气度、社会对毕业生的认可程度、毕业生的个人努力程度、个人机遇这几个指标是不宜用数据描述和衡量的,所以将这些因素暂不列为考虑范畴。第二个考虑的影响程度是在校GMAT 分数,毕业生的录用及认可程度一般会受到个人能力的影响,而个人能力的养成及巩固一般会在学校完成,其衡量标准普遍为GMAT 分数。第三个影响因素为进入MBA 前的工资,当入学前就有较高的薪水时,说明该毕业生入学前的能力维持在较高水平,一般情况下,经过深造,个人能力、学识及价值观等诸多因素都会有大幅度提升,那毕业后的薪酬很明显只增不减。
第3 章 模型的建立与分析
3.1 模型初步建立
图3-1 关于WS、PS、AT 等三个变量的直方图
由图3-1 直方图可知,所采集的数据均呈正态分布,因此对数据进行pearson 相关系数分析,观察数据的相关程度。Pearson相关系数是一个描述线性相关强度的量,取值于-1 和1 之间。当两个变量有很强的相关性且相关系数接近于1(正相关)或-1(负相关),而当这两个变量不那么相关时,先关系数就接近于0.
3.2 模型的检验与分析
在总体的正态性假设下,可以建立与其相关的统计量来检验线性相关系数r 是否为0(零假设为r=0)。在两个变量定义了相关系数之后,一组变量可以定义相关阵。假设共有P 个变量,他们的相关阵为一个PxP 矩阵,其中第ij 个元素为第i 个变量和第j 个变量的相关系数。对角线元素是变量和自己的相关系数,等于1.
由表3-1 可知,PS、AT 和GMAT 与WS 的相关系数为0.822、0.924 和0.784,其显著性水平均小于0.05,则检验显著,即,三个变量与WS 的相关,其相关程度分别为82.2%、92.4% 和78.4%。三个自变量与因变量呈正线性相关。将PS、GMAT 和AT作为自变量,WS 作为因变量进行回归。
由表3-3 模型汇总表可知R 平方为0.877,即,自变量对因变量的解释程度为87.7%,对多个自变量的情况来说,调整后的R平方为87.1%,即,多个自变量对因变量的解释程度为87.1%。另有F 检验的统计量为133.282,p 值明显小于0.0001,也就是小于显著性水平α(0.001),则检验显著,模型拟合。
表3-4 是对模型各个系数的检验:令y 为WS,X1 为PS,X2为AT,X3 为GMAT,假设模型为y=β1X1+β2X2+β3X3;对于常数,假设检验问题为b=0b ≠ 0,由表3-4 得,双尾检测p 值为0.002,则单尾检测p=0.002/2 < α(0.005),即,检验显著,常数不为0,由表得b=2.65;同理,对于β1、β2、β3 均有p < α(0.005), 则β1、β2、β3 均不为0, 由表得其值为β1=2.066、β2=0.276、β3=0.06.
那么,回归模型为y=2.65+2.066x1+0.276x2+0.06x3第4 章 结论
根据对选取建立的模型以及数据的分析,我们认为模型通过了检验,所建立的模型是合理、有效的。即MBA 毕 业生的年薪与进入MBA 前的薪资、学费及学分是线性相关的。
在三种影响因素中,根据模型可知,MBA 毕业生的年薪与进入MBA 之前的薪资相关性更大,即毕业生年薪与进入MBA 前薪资的变化呈明显正相关关系。高昂的学费除了代表学校MBA 教学上更--- 多的投入外,还会受到地域差异和消费水平差异的影响。
参考文献:
[1] 吴喜之. 统计学:从数据到结论[M]. 北京:中国统计出版社,2009.9
[2] 魏瑾瑞,蒋萍. 数据科学的统计学内涵[J],统计研究,2014,31(5):1-7
[3] 曾小敏,彭扬琴,杜蕾,刘兮,阳赣萍,孙振球,王一任. 医学统计学成绩影响因素的有序Logistic 回归分析[J],中国现代医学杂志,2014,24(29):106-112