|
|
1.资料名称:2024-2000年上市公司企业数字技术风险暴露数据、数据风险暴露、网络风险暴露数据
2.测算方式:参考《经济研究》陆瑶(2025)老师的做法,,采用 FinBERT 大语言模型①对企业年度报告中部分涉及数字技术安全的相关论述进行文本情感识别,从而构建企业—年份层面的数字技术风险指标。大语言模型是指用于处理自然语言信息的大型人工智能模型,其中,FinBERT是国内首个在金融领域大规模语料上训练的开流模型。这类模型利用注意力机制,得出对每个词上下文敏感的表示,能够捕获文本中的长距离依赖性和复杂关系,从而更细致地理解和生成语言,具体内容如下图,测算起来比较复杂
最终结果是三个指标
(1)数字技术风险暴露,企业MD&A涉及数字技术风险的文本中,负面文本的负面情感概率最大值与正面文本的正面情感概率平均值之间的差值
(2)数据风险暴露,企业MD&A涉及数据风险的文本中,负面文本的负面情感概率最大值与正面文本的正面情感概率平均值之间的差值
(3)网络风险暴露,企业MD&A涉及网络风险的文本中,负面文本的负面情感概率最大值与正面文本的正面情感概率平均值之间的差值
此数据在2026年1月份进行了更新,我们做了两份均给到大家,一份是按照上市公司年报做的(旧版),一个是管理层讨论与分析做的(新版),分别对应的原始数据、代码及最终计算结果数据更新原因是原文就是按照管理层讨论与分析做的,并且旧版年报数据较大如下图所示大多在0.9左右,带入论文会可能会不显著或者调节显著较为困难,而新版管理层讨论与分析却能很好规避这个问题,数据相对合理很多,从学术角度来看建议大家用新版数据,因为在做一遍真的非常不容易除非像这种很有必要的!
3.资料范围:新版和旧版数据都给大家,大家可以有选择使用。旧版数据上市公司年报样本为4.5万个样本,5408家企业(如下方第四张图片),新版数据管理层讨论与分析样本为1万多个样本,3169家企业(如下方第六张图片)
包括原始数据、部分计算代码(python,数据处理非常复杂,需要较强数据处理技术和安装包,因此代码仅供参考不教学)、测算说明及最终结果,大家可以验证一下确保准确性!
4.参考文献:
陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.
此数据为科研课题组自用数据,非仅仅只有一个结果胡编乱造(根据参考文献瞎编结果根本就没有研究价值,不能反映真正的数字技术风险,实证围绕着错的结果根本就毫无意义浪费大家时间),真正的原创一手认真整理数据,数据处理较为复杂大家可以自行试试!
此资料复刻了原文,购买了原文也可以下载此资料,并且附带全文讲解,掌握全文逻辑对自己学习有帮助,大家有需要可以看一下!
2025年经济研究复现复刻《中国企业数字技术风险暴露对企业价值的影响》(大语言模型的文本分析、供应链传播、数字基础设施互联性、声誉损失)
https://www.caomeikeyan.com/forum.php?mod=viewthread&tid=6386
(出处: 草莓科研服务网——中国专业社科交流平台)
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号? 建议用 立即注册
x

|