|
1.资料名称:2024-2000年上市公司企业人工智能技术应用数据、AI技术应用数据
2.测算方式:参考顶刊《中国工业经济》李玉花(2024)老师研究的做法,本文采用机器学习方法生成四类AI技术的词典,进而构造AI技术应用水平。AI词典的生成步骤为:①将从巨潮资讯网上爬取的企业年报进行预处理,包括将企业年报数据转为txt格式,并利用Jieba库进行分词处理,为克服中文文本分析中新词、歧义词识别的难点,本文将AI专有名词词典也一并加入Jieba的分词模块中。②根据本文对AI技术的分类,并参考艾瑞咨询《中国人工智能产业研究报告(V)》德勤咨询《中国与全球企业人工智能应用现状调研》(2020)等研报信息以及国际货币基金组织(IMF)提供的AI词汇表,将种子词设为“机器学习”“自然语言处理”“计算机视觉”和“知识表示”。③参考姚加权等(2024)的做法,使用Word2vec技术,采用Skip-gram模型,将维基百科和随机抽取的20%.上市企业数据作为语料进行训练。基于种子词与输出词的余弦相似度,为每个种子词找到语义上最相似的10个词。④通过移除重复和与各AI技术分类不直接相关的词汇,并添加具有相同或相似语义的词汇,最终构建出一个专门用于分析AI技术应用的词汇库。⑤利用文本分析,将上市企业年报中AI技术关键词数量加1取对数来测量AI技术应用。
3.资料范围:5700多家企业,6.7万个样本,包括原始数据词频(40多个AI技术应用词频)及最终计算结果,大家可以验证一下确保准确性!
4.参考文献:
李玉花,林雨昕,李丹丹.人工智能技术应用如何影响企业创新[J].中国工业经济,2024,(10):155-173.DOI:10.19581/j.cnki.ciejournal.2024.10.009.
此资料复刻了原文,购买了原文也可以下载此资料,并且附带全文讲解,掌握全文逻辑对自己学习有帮助,大家有需要可以看一下!
顶刊论文复刻全文老师讲《人工智能技术应用如何影响企业创新》(发明专利、AI技术应用、工具变量法、知识多样性、遗漏变量偏误检验、选择偏误)
https://www.caomeikeyan.com/forum.php?mod=viewthread&tid=6199
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号? 建议用 立即注册
x

|