|
|
1、资料名称:2026-2015年上市公司企业用工需求数据、网络招聘数据的用工需求数据
2、测算方式
本数据集的测算方法严格遵循刘歆(2025)发表于《财政研究,》的经典方法,核心指标为企业用工需求对数(LABOR = ln(年度总招聘需求人数 + 1)),完整测算逻辑如下:
(1)数据清洗与字段解析
原始招聘数据来源于中国上市公司在主流互联网招聘平台发布的招聘信息,约10GB、899万行原始记录。通过Python脚本分块读取(chunksize=500,000)逐块处理,避免内存溢出。核心解析规则包括:
- 招聘人数解析:文本型字段按规则转换为数值——"3人"提取3、"5-10人"取区间均值7.5、"若干""不限""数名""多名"及缺失值均保守估计为1人;
- 学历解析:含"本科""硕士""博士""研究生""MBA""EMBA"标记为高学历(1.0),含"大专""中专""高中""初中"等标记为非高学历(0.0),"不限"或无法判断设为NaN;
- 经验要求解析:"1-3年"取中值24个月,"3年以上"取36个月,"应届毕业生""不限"设为0;
- 全职标记:招聘类别含"全职"标记为1.0,否则为0.0。
(2)企业-年份聚合
对每块数据按(股票代码,年份)分组聚合,计算总招聘需求人数(sum)、招聘岗位发布数(count)、岗位种类数(nunique)、平均最低/最高月薪(mean)、高学历岗位数(sum)等指标,跨块合并后重新聚合生成最终面板数据。
(3)核心指标生成:我们多做了几个,大家可以做核心变量或者稳健型检验
- 核心被解释变量:企业用工需求对数 = ln(总招聘需求人数 + 1)
- 衍生指标:高学历需求占比 = 高学历岗位数 / 高学历可判断数;全职岗位占比 = 全职岗位数 / 招聘岗位发布数
- 薪资指标:平均最低月薪、平均最高月薪(元,取整)
3、资料范围
原始数据来自中国上市公司在智联招聘、猎聘网、前程无忧、应届生求职网等主流互联网招聘平台公开发布的招聘信息
企业-年份面板:53,063 条观测 涉及企业:5,643 家上市公司,2025年为全年数据,资料内还包含2026年部分数据,但2026不完整!
资料包括原始招聘数据、Python完整测算代码、 Stata测算代码、详细复现说明(含分类逻辑、验证方法,复现说明大家可以根据文档一步步复现学习)及最终结果,资料真正能够使用并且可以公开)和最终计算结果,大家可以验证一下确保准确性!
4、参考文献
刘歆, 杨亚平. 政府采购对企业用工需求的影响研究——来自网络招聘数据的分析[J]. 财政研究, 2025(5): 114-128.
本资料是课题组自用数据,原始数据和代码都是真实有效的,附带完整复现说明,测算结果可以做重复实验验证,确保准确性!
此资料建议加会员,加入会员可以免费获取!
会员社区 草莓科研服务网——中国专业社科交流平台
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号? 建议用 立即注册
x

|