计算原理与概率统计

以 2010-2026 年中国大学毕业生(本/硕/博)就业率与薪酬数据为实例

数据维度选择

学历层次
专业对比指标

总体就业率趋势

数据来源:麦可思研究院《中国本科生就业报告》、教育部就业质量报告、各高校就业质量报告。2010-2024年为实际统计/报告数据,2025-2026年为基于趋势的合理预测。工科已细分为计算机、软件工程、电子信息、自动化、机械、新能源、土木等方向。

各专业走势对比(本/硕/博)

各专业薪酬趋势(2010-2026年)

薪酬数据基于麦可思2024年报告、各高校就业质量报告及行业调研推算。博士薪酬包含高校教职、科研院所及企业研发岗位。选择专业查看该专业历年薪酬走势。
2024年本科月薪
6,800元
2024年硕士月薪
11,000元
2024年博士月薪
18,300元
2010-2024薪酬涨幅
143%

18个专业薪酬横向对比(2024年)

横向对比18个专业2024年本科、硕士、博士的起薪水平,直观展示学历提升对各专业薪酬的影响幅度。

各专业就业率数据表(%)

专业/年份 2010201220142016 20182020202220242026

六大产业人才需求指数(2010-2026年,2010年=100)

基于人社部、智联招聘、BOSS直聘等平台发布的行业人才需求报告整理。

供需匹配分析 — 就业率 vs 产业需求

2024年 各专业就业率与对应产业需求散点图
就业分布直方图(2024年)

统计量计算

就业率统计量(18个专业)
样本均值
87.7%
平均就业率
样本方差
28.4
离散程度
标准差
5.3%
平均偏离
中位数
86.5%
中间位置
最大值
97.2%
最高就业率
最小值
79.0%
最低就业率
极差
18.2%
Max − Min
变异系数
6.1%
σ / μ
薪酬统计量(元/月)
平均薪酬
月薪均值
薪酬中位数
中间薪酬
最高薪酬
月薪最高
最低薪酬
月薪最低

大数定律实例 — 样本量与估计精度

从18个专业中随机抽样,观察样本量增大时样本均值如何收敛于真实总体均值。真实均值为2024年18个专业就业率的平均值。

中心极限定理实例

反复从18个专业中抽取n个专业计算平均就业率,观察这些均值的分布是否趋近正态分布。

统计学核心概念(以就业数据为例)

样本与总体
总体是全国所有高校毕业生,样本是报告中的调研对象。麦可思报告覆盖31个省份,样本量超10万份。
样本均值 x̄ ≈ 总体均值 μ
均值与方差
均值反映平均就业水平,方差反映专业间差异。如2024年本科就业率均值88.7%,方差26.5,说明专业差异显著。
Var = Σ(xᵢ − x̄)² / (n−1)
条件概率
已知某产业需求高的条件下,对口专业就业率如何?如新能源产业需求指数460条件下,新能源专业就业率97.2%。
P(就业|需求高) = P(就业∩需求高) / P(需求高)
相关性与回归
产业需求与对口专业就业率的散点图可揭示两者关联。新能源、IT产业需求与就业率呈强正相关。
r = Cov(X,Y) / (σₓσᵧ)
大数定律
调研样本越多,估计的就业率越接近真实值。从18个专业中抽样,样本量从2增至1000,均值趋于稳定。
lim P(|x̄ − μ| < ε) = 1
中心极限定理
反复从18个专业中抽样计算平均就业率,这些均值的分布趋近正态分布,可用正态分布进行统计推断。
x̄ ~ N(μ, σ²/n)
置信区间
根据样本估计总体就业率的范围。如调查1000名毕业生,就业率85%,则95%置信区间为 85% ± 1.96×√(0.85×0.15/1000)。
x̄ ± z·σ/√n
假设检验
检验"计算机类本科就业率显著低于医学类"是否成立。通过t检验比较两组均值差异的显著性。
t = (x̄₁ − x̄₂) / SE

统计公式与就业分析应用

样本均值
x̄ = (Σxᵢ) / n
样本方差
s² = Σ(xᵢ − x̄)² / (n−1)
标准差
σ = √Var(X)
中位数
Med = 排序后中间值
变异系数
CV = σ / x̄
相关系数
r = Cov(X,Y) / (σₓ·σᵧ)
正态分布
X ~ N(μ, σ²)
95% 置信区间
x̄ ± 1.96·σ/√n