草莓科研服务网——中国专业社科交流平台

 找回密码
 立即注册

快捷登录

查看: 3757|回复: 6

【核心变量】2023-2001年上市公司企业数字创新数据(数字产品、流程、业务模式创新)

[复制链接]
发表于 2024-10-14 11:06:56 | 显示全部楼层 |阅读模式
1.资料名称:2023-2001年上市公司企业数字创新数据

2.测算方式:参考《系统工程理论与实践》郑攀攀(2024)老师的做法,本文基于上市公司年报文本, 结合文本分析和机器学习方法, 测度了企业数字创新(DI) . 具体的测度步骤如下: ①确定企业年报中关于数字创新表述的种子词集. 本文紧扣相关文献对数字创新的定义[2-4,6], 从《中小企业数字化赋能专项行动方案》、《2020 年数字化转型趋势报告》等官方文件中选取种子词集[45], 包括人工智能、数据挖掘、电子商务等 45 个词组. ②基于机器学习方法扩充种子词集. 鉴于同一概念或事物的表达, 往往可以采用多个语义相似的词汇, 本文采用机器学习算法扩充关键词词集. 具体地, 使用海量财经文本训练 Word2vec 神经网络相似词算法, 取每个种子词组的前 30 个相似关键词, 去除重复词汇和部分低频词汇, 由三名专业人员根据 Fichman 等[3]提出的定义进行词汇分类筛选以及核验工作, 最终得到 99 个关键词词集, 如表 2 所示. ③测度企业数字创新. 本文对企业年报中关于数字创新的关键词进行抓取, 将数字产品创新 DI_prod、数字流程创新 DI_proc、数字商业模式创新 DI_buss 三个维度词频之和占年报全文总词数比重作为企业的整体数字创新 DI. 为了避免数据量纲过小, 对上述指标作出乘以 100 的处理
3.资料范围:6.1万个样本,5598家企业,包括原始数据词频和最终计算结果,大家可以验证一下确保准确性!
4.参考文献:

郑攀攀,庄子银.知识产权司法保护专门化与企业数字创新[J].系统工程理论与实践,2024,44(05):1501-1521.





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
 楼主| 发表于 2024-10-14 11:07:25 | 显示全部楼层
此资料在会员数据目录中,加入会员可免费获取!
加入会员!海量资料免费下载!【价格真的优惠】(stata代码、上市公司数据、数字经济数据、银行数据、统计年鉴数据)
https://www.caomeikeyan.com/forum.php?mod=viewthread&tid=6884
(出处: 草莓科研服务网——中国专业社科交流平台)
回复

使用道具 举报

发表于 2024-10-14 14:50:47 | 显示全部楼层
好人一生平安,感谢楼主
回复

使用道具 举报

发表于 2024-10-15 18:27:42 | 显示全部楼层
感谢楼主分享资料!
回复

使用道具 举报

发表于 2024-10-17 14:35:21 | 显示全部楼层
感谢楼主分享资料!
回复

使用道具 举报

发表于 2024-10-17 15:07:59 | 显示全部楼层
感谢楼主分享资料!
回复

使用道具 举报

发表于 2024-10-20 11:30:38 | 显示全部楼层
感谢分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

回帖奖励

[详情]

  • * 每天自己主题被回复3次可获得额外5论坛币奖励。
  • * 每天回复他人主题5次可获得额外8论坛币的奖励。
  • * 奖励每天都可领取,一定要多参与论坛讨论哦。
  • * 同一主题的重复回复不计。
  • 草莓科研服务网——中国专业社科交流平台 ( 津ICP备2023000499号 )|网站地图

    GMT+8, 2025-5-2 21:28 , Processed in 0.135741 second(s), 62 queries .

    Copyright © caomeikeyan

    快速回复 返回顶部 返回列表