|
本帖最后由 xiaoniu666 于 2025-3-4 15:07 编辑
1.资料名称:2023-2001年上市公司企业数字化转型指标数据
2.测算方式:参考《中国工业经济》袁淳(2021)老师的做法
借助数字经济相关的国家政策语义表述,建立一个相对完备的数字化词典,并利用基于机器学习的文本分析法,构建一个较为全面反映中国上市企业数字化程度的指标。 具体步骤
如下:
第一步,构建企业数字化术语词典。 由于缺乏专门的数字经济领域的术语词典,本文以国家政策语义体系为基础构建企业数字化术语词典。 借鉴何帆和刘红霞(2019)等的研究,通过对中央人民政府、工业和信息化部网站进行检索,人工筛选得到 2001—2023 年期间发布的重要的国家层面数字经济相关政策文件以用于提取企业数字化相关的关键词。经 Python 分词处理及人工识别,最终筛选得到 197 个频率大于等于 5 次的企业数字化相关词汇, 这些词汇构成了本文的企业数字化术语词典。
第二步, 对年报相关语段进行文本分析。 本文把上述数字化术语词典中的 197 个词汇扩充到Python 软件包的“jieba”中文分词库,然后基于机器学习的方法对上市公司年报“管理层讨论与分析”(MD&A)部分进行文本分析,统计得到 197 个与企业数字化相关词汇在年报中出现的频率。
第三步,企业数字化程度指标的构建。 考虑到年报 MD&A 部分文本长度的差异,在提取得到每家上市公司每年年报中各个关键词的出现频率后, 本文采用企业数字化相关词汇频数总和除以年报 MD&A 语段长度衡量微观企业数字化程度(Digital)。 为了表述方便,本文将该指标乘以 100。Digital 指标数值越大,表示企业数字化程度越高。
3.资料范围:5593个企业,6万多个样本,包括原始数据词频、python代码、stata计算代码和最终计算结果,真正的197个词频处理后的,真正能够使用而非任意编造,大家可以验证一下确保准确性!
4.参考文献:
袁淳,肖土盛,耿春晓等.数字化转型与企业分工:专业化还是纵向一体化[J].中国工业经济,2021,No.402(09):137-155.DOI:10.19581/j.cnki.ciejournal.2021.09.007.
这是市面上首次更新的2023年数据,真正的原创一手数据,此数据为科研老师一手认真整理,非为了结果任意编造数据,2023年已经更新,我们是专业老师整理,多年更新无售后问题百分百准确,个人整理无经验易出错,资料准确能用最关键!
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x

|