|
1.资料名称:2023-2007年上市公司企业数据资产信息披露程度数据
2.测算方式:参考C刊《当代财经》牛彪(2024)老师的做法,具体测度步骤分为以下三步:第一,2019 年中国信息通信研究院发布的 《数据资产管理实践白皮书 (4.0 版)》 指出,数据资产是能够为企业带来经济利益的数据资源。因此,本文将“数据资产”和“数据资源”均作为种子词汇。第二,采用深度学习技术手段与 Word2Vec 神经网络模型,得到上述种子词汇的相似词词集,并只保留了相似度最高的前 10 个词以确保测度的准确性,具体词典如表1 所示。另外,考虑到“基础信息”一词可能是对公司基本信息情况进行介绍,因而删除了该相似词。第三,挖掘并统计所有词汇在年报中每年出现的频次,并通过式 (1) 来计算数据资产信息披露水平。DADit = ∑Dictionarywords ( )itn TotalWords ( ) it ×100 (1)其中,Dictionarywordsitn为词典中第 n 个词汇在第 t 年的个股 i 年报的精确词频;TotalWordsit 为第 t 年的个股 i 年报中排除英文和数字之后的总词频。数据资产披露 (DAD) 具体的计算过程为词典中精确词频之和占年报中排除英文和数字之后的总词频的比例, 最终结果为数据资产关键词占年报总词频百分比,具体可以看一下文献!
3.资料范围:50多万个样本量,5560家企业,电子表格面板数据可以直接使用,原始数据来源于上市公司年报,使用文本分析法测量,大家可以验证一下真伪确保准确性!
4.参考文献:牛彪,于翔,苑泽明,等.数据资产信息披露与审计师定价策略[J].当代财经,2024,(02):154-164.DOI:10.13676/j.cnki.cn36-1030/f.20231213.001.
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号? 建议用 立即注册
x

|