1、资料名称:2024-2000年上市公司企业人工智能技术采用水平数据
2、测算方式:参考《管理评论》周源(2025)老师的做法,本文采用一种基于机器学习方法逐句判断年报句子内容是否表明企业采用AI 技术的方法来测量自变量,基本流程如下:
第一步:形成文本分析对象。上市公司年报的“ 管理层讨论与分析” (MD&A)部分报告了企业经营情况、未来发展战略和公司所面临的风险状况,常被用作企业数字化转型和AI 技术采用的分析对象。本文从年报文本中抽取该部分内容形成文本分析对象。第二步:基于生成式大语言模型构建标注数据集。根据句号和分号逐句切分MD&A 文本。本文的目标是训练机器学习模型判断每个句子的内容是否表明企业采用了AI 技术,这就需要标注一部分句子形成训练集。在构建训练集时, 本文面临2 个挑战:第一, 年报中大多数句子与AI 技术无关, 如果完全随机抽取句子进行标注, 得到的大多数标签将与AI 技术无关;第二, 由于上市公司总数逐年增加, 如果随机抽取句子进行标注,将导致大部分被标注的句子靠近当前年份。为此,本文首先从相关文献[3 ]中收集了包含157 个关键词的AI 技术词典。然后基于AI 技术词典将所有句子分为包含AI 关键词的句子和不包含AI 关键词的句子。接着,本文按照年份分组, 在每个年份抽取500 个包含AI 技术关键词的句子和500 个不包含AI 技术关键词的句子形成待标记数据集。最后, 本文选择生成式大语言模型GLM-4① 对待标记数据集进行标注,提示词如下:你是一位资深的人工智能专家。请判断下列句子是否表明企业采用了人工智能技术。仅回答“ 1” 或“ 0”:回答“ 1” 表示企业采用了人工智能技术,回答“ 0” 表示未采用。最终, 本文使用表明企业采用AI 技术的句子数量来衡量企业AI 技术采用水平,具体做法如下图文献所示 3、资料范围:6万多个样本,5700多家企业,包括原始数据、计算代码、运行视频(由于运行时间太长,因此我们截取了部分,证明此代码是真实能运行的)及最终计算结果,大家可以验证一下确保准确性! 4、参考文献: 周源,代兴良,许冠南.人工智能如何影响企业颠覆性绿色创新——基于知识重组的视角[J].管理评论,2025,37(11):206-218.
|