草莓科研服务网——中国专业社科交流平台

 找回密码
 立即注册
建议用户用微信快捷登录

快捷登录

查看: 561|回复: 6

2024-2001年上市公司企业MD&A叙述性信息披露数据、MD&A文本相似度数据

[复制链接]
发表于 2026-3-18 10:00:37 | 显示全部楼层 |阅读模式
1、资料名称:2024-2001年上市公司企业MD&A叙述性信息披露数据、MD&A文本相似度数据
2、测算方式:参考顶刊《南开管理评论》于李胜老师的做法, V S M 模 型与 T F-IDF 算法相结合,把上市公司 M D&A 文本与同一年度其他 上市公司分别进行比较,并计 算出文本之间的向量夹角余弦值,即文本相似度。具体步骤如下 : 利用 VS M 模型将每份文本向量化,即转换为欧氏空间 n 维向量,其中 n 是所有文本中非重复词的数量。每 个向量 元 素是文 本 j 中特定词 i 出现的频率, 同时用文本 j 的总词数 进行加权以防止其偏向长文本, 得到词T F i , j = n i , j /( ∑ k n k , j ),其中分 子为特定词 i 在文本 j 中出现的次数,分 母为文本 j 中所有词 {k} 出现的次数之和。 通 过特定词的逆 文 档 频率赋 予不同的权 重, 即I DFi =log D/({ j;t i dj}+1),其中,D 为样本中文本数量,{ j;ti dj} 为包含特定词 i 的文本数。采用公司与同一年度其他公司的文本相似度的均值来衡量,具体做法及公式如下方图片所示

3、资料范围:6.5万个样本,5600多家企业,包括原始数据、计算代码及最终结果,大家可以验证一下确保准确性!
4、参考文献:
于李胜,王泽豪,王艳艳,等.创新对企业MD&A叙述性信息披露策略的影响[J].南开管理评论,2024,27(03):150-162.

此资料建议加会员,加入会员可以免费获取!
会员社区 草莓科研服务网——中国专业社科交流平台






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号? 建议用 立即注册

x
 楼主| 发表于 2026-3-18 10:01:11 | 显示全部楼层
此资料在会员数据目录中,加入会员可免费获取,会员性价比之王可以任意对比!
加入会员!海量资料免费下载!【价格真的优惠】(stata代码、上市公司数据、数字经济数据、银行数据、统计年鉴数据)
https://www.caomeikeyan.com/forum.php?mod=viewthread&tid=6884
(出处: 草莓科研服务网——中国专业社科交流平台)
回复

使用道具 举报

发表于 2026-3-19 09:11:42 | 显示全部楼层
感谢分享
回复

使用道具 举报

发表于 2026-3-19 14:42:51 | 显示全部楼层
感谢楼主分享资料!
回复

使用道具 举报

发表于 2026-3-20 09:47:47 | 显示全部楼层
感谢分享
回复

使用道具 举报

发表于 2026-3-21 08:51:20 | 显示全部楼层
好人一生平安,感谢楼主
回复

使用道具 举报

发表于 2026-3-22 05:19:37 | 显示全部楼层
好人一生平安,感谢楼主
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 建议用 立即注册

本版积分规则

回帖奖励

[详情]

  • * 每天自己主题被回复3次可获得额外5论坛币奖励。
  • * 每天回复他人主题5次可获得额外8论坛币的奖励。
  • * 奖励每天都可领取,一定要多参与论坛讨论哦。
  • * 同一主题的重复回复不计。
  • 草莓科研服务网——中国专业社科交流平台 ( 津ICP备2023000499号 )|网站地图

    GMT+8, 2026-5-2 21:11 , Processed in 0.132427 second(s), 62 queries .

    Copyright © caomeikeyan

    快速回复 返回顶部 返回列表