|
1、资料名称:2025-2003年上市公司企业产业型战略股东数据 2、测算方式:参考顶刊《会计研究》蔡贵龙(2025)老师的做法,考虑到经营范围数据的可获得性, 本文以上市公司披露的前十大股东中除控股股东及其一致行动人之外的法人股东为研究对象。 借鉴覃飞和沈艳 ( 2021) 的研究, 采用等权和加权法下的词频—逆文档频率模型 ( Term Frequency-Inverse Document Frequency, TF-IDF) 来测算每个法人股东与上市公司经营范围的文本相似度。此外, 由于一家上市公司可能存在多个法人股东, 本文借鉴刘 伟 和 曹 瑜 强 ( 2018) 、 黎 文 靖 和 严 嘉 怡 ( 2021)的做法, 以法人股东的持股比例为权重, 进一步构造加权的公司—股东经营范围相似度,具体做法及公署如下图文献所示 3、资料范围:5.6万个样本,5500多家企业,包括原始数据、计算代码及最终计算结果,大家可以验证一下确保准确性!
需要说明的是此数据是2025年12月中旬整理的,因此2025年数据是大部分都有的
4、参考文献: 蔡贵龙,贺家琼,郑国坚.产业型战略股东与国有企业合规风险治理——基于股东—公司经营范围相似度视角[J].会计研究,2025,(05):62-77.
|