|
|
1、资料名称:2025-2000年上市公司企业绿色信息披露数据
2、测算方式:参考顶刊《金融研究》李志辉老师的做法,首先以近五年党中央、国家有关部门颁布的重要政策文件以及国家领导人的相关讲话文本,作为指导金融机构实现“碳达峰、碳中和”目标的绿色金融政策。经文本词频统计、排序后筛选得到有效高频词表,提取前二十五位名词作“种子词”。其次,以中国人民银行官网发布的绿色金融相关政策文件、国有商业银行的社会责任报告文本等作为语料库,经文本清洗步骤后,使用Word2vec 机器学习技术进行词向量挖掘,根据种子词与输出词语之间的余弦相似度,针对每个种子词筛选出20个与其语义程度最相近的词语,获得扩充的基础词集。通过大语言模型和人工辅助删去非名词短语、通用商业词汇、金融基础术语、过于生僻的词语和其他无关词,得到包含85个关键词的词汇池。再次,本文采用Jieba 中文分词模块对年报文本进行分词。通过 Python调用API服务,对2012—2023年样本银行的年度报告中包含关键词的语境单元进行情感分析。情感分析规则借鉴 Giannetti et al.(2023),若银行在语境单元中披露具体的绿色信贷投放、减排成效、环保项目合作等的绿色行动及成效则正面表述,赋值为1,若该语境单元仅提及中性的政策名称、政策内容、行业术语,赋值为0,若银行披露环境违规、污染处罚、绿色目标未达成等负面信息,则赋值-1。将上述语境单元的情感分析的得分加总后以年报总字数加权。最后,为提高回归结果的可读性,将该指标乘以100得到 Shy 作为商业银行绿色信息披露指标。
3、资料范围:7.2万个样本,5900多家企业(这里是指所有上市公司,包括商业银行上市公司),包括原始数据、计算代码、计算代码视频录制(确保是代码真实可以向期刊公布,非自己主观生成,由于运行时间太长因此有开始和结束部分)及最终计算结果,大家可以验证一下确保准确性!
4、参考文献:
李志辉,常心宇,魏斌,等.“言”“行”合一?气候政策不确定性与商业银行绿色响应[J].金融研究,2026,(5):96-114.
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号? 建议用 立即注册
x

|