草莓科研服务网——中国专业社科交流平台

 找回密码
 立即注册

快捷登录

查看: 1382|回复: 3

2022-2000年上市公司企业数字化转型指标数据(袁淳老师版本)

[复制链接]
发表于 2023-6-15 09:24:20 | 显示全部楼层 |阅读模式
1.资料名称:2022-2000年上市公司企业数字化转型指标数据0 E% Y  e' I1 g* e
2.测算方式:参考《中国工业经济》袁淳(2021)老师的做法
" G3 c1 h3 T: }; }2 L  Q  x借助数字经济相关的国家政策语义表述,建立一个相对完备的数字化词典,并利用基于机器学习的文本分析法,构建一个较为全面反映中国上市企业数字化程度的指标。 具体步骤
$ P$ X- p! a9 ~如下:, Q/ C7 w8 L9 ^3 i) z) l* L- }) l: R
第一步,构建企业数字化术语词典。 由于缺乏专门的数字经济领域的术语词典,本文以国家政策语义体系为基础构建企业数字化术语词典。 借鉴何帆和刘红霞(2019)等的研究,通过对中央人民政府、工业和信息化部网站进行检索,人工筛选得到 2000—2022 年期间发布的重要的国家层面数字经济相关政策文件以用于提取企业数字化相关的关键词。经 Python 分词处理及人工识别,最终筛选得到 197 个频率大于等于 5 次的企业数字化相关词汇, 这些词汇构成了本文的企业数字化术语词典。' ^0 H1 ?! m) l* n( W6 f* c9 ^
第二步, 对年报相关语段进行文本分析。 本文把上述数字化术语词典中的 197 个词汇扩充到Python 软件包的“jieba”中文分词库,然后基于机器学习的方法对上市公司年报“管理层讨论与分析”(MD&A)部分进行文本分析,统计得到 197 个与企业数字化相关词汇在年报中出现的频率。, U9 r* _" v$ [8 Z4 S) @9 j
第三步,企业数字化程度指标的构建。 考虑到年报 MD&A 部分文本长度的差异,在提取得到每家上市公司每年年报中各个关键词的出现频率后, 本文采用企业数字化相关词汇频数总和除以年报 MD&A 语段长度衡量微观企业数字化程度(Digital)。 为了表述方便,本文将该指标乘以 100。Digital 指标数值越大,表示企业数字化程度越高。
2 \! v% Q5 W/ ?( z5 x9 }; _4 n& C$ M3.资料范围:包括原始数据、python代码、计算代码和最终计算结果,最终计算结果为dig和Dig,  dig乘以100为Dig
9 s3 s  |9 C# e: u4.参考文献:
! ^9 w; e) M8 ?% z  H$ V0 y袁淳,肖土盛,耿春晓等.数字化转型与企业分工:专业化还是纵向一体化[J].中国工业经济,2021,No.402(09):137-155.DOI:10.19581/j.cnki.ciejournal.2021.09.007.
5 d/ r  X9 D. j9 X& G

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
发表于 2023-11-20 10:08:53 | 显示全部楼层
好资料
回复

使用道具 举报

发表于 2023-12-21 13:43:07 来自手机 | 显示全部楼层
提示: 该帖被管理员或版主屏蔽
回复

使用道具 举报

发表于 2024-5-8 15:59:45 来自手机 | 显示全部楼层
很好用
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

回帖奖励

[详情]

  • * 每天自己主题被回复3次可获得额外5论坛币奖励。
  • * 每天回复他人主题5次可获得额外8论坛币的奖励。
  • * 奖励每天都可领取,一定要多参与论坛讨论哦。
  • * 同一主题的重复回复不计。
    • 天**** 购买了本资料
    • 小**** 购买了本资料
    • V**** 购买了本资料
    • g**** 购买了本资料
    • 关**** 购买了本资料

    草莓科研服务网——中国专业社科交流平台 ( 津ICP备2023000499号 )|网站地图

    GMT+8, 2024-5-20 14:11 , Processed in 0.099212 second(s), 62 queries .

    Copyright © caomeikeyan

    快速回复 返回顶部 返回列表