|
1.资料名称:2022-2001年地级市数字经济政策文本词频数据、城市数字经济政策词频数据 ` Y4 r* Q4 t( P( P
2.测算方式:参考C刊《统计与信息论坛》金灿阳(2022)老师和C刊《当代财经》陶长琪(2023)老师的做法,从地方政府报告爬取相关词频,构造数字经济政策文本词频数据,具体为从地方政府网爬取工作报告原始文件3 H& X2 t/ _/ S
9 a3 K; }* C8 V1 F# D: K将报告文本整理为面板数据4 r" Z! I- R' d, ~9 J- u$ T
! E! F# Y$ t9 z: c2 X, l, O去除停顿词,利用python的jieba库进行分词,统计词频数7 h5 O" a! P3 M. \
( g& D; |! m. L b0 R7 p保留中英文、数字、标点符号,利用正则表达式统计60个词频
( Q' X8 W* {+ L5 b9 X0 E% w# D
; d8 r" l8 z$ T7 ~& E5 r0 B保留中英文、数字,统计全文文本总长度% w" O' n4 L: O, k0 S
0 b6 }1 u i' H. B2 _
保存文本词频总数、60个词频明细、文本长度7 z. @( l; o) G. `. x$ L
3.数据指标:323个地级市,6264个样本,使用两种方式测算,均可使用并且可以做稳健性检验; s3 ~' e) F3 _
具体指标为 行政区划代码 年份 城市名称 所属省份 文本总字数 仅保留中英文_文本总字数 文本总词数 仅保留中英文_文本总词数 数字经济政策词频和-A 数字经济政策词频和-B 数字经济_A 智能经济_A 信息经济_A 知识经济_A 智慧经济_A 数字化信息_A 现代信息网络_A 信息和通信技术_A ICT_A 通信基础设施_A 互联网_A 云计算_A 区块链_A 物联网_A 数字化_A 数字乡村_A 数字产业_A 电子商务_A 5G_A 数字基础设施_A 人工智能_A 电商_A 大数据_A 数据化_A 产业数字化_A 数字产业化_A 数据资产化_A 智慧城市_A 云服务_A 云技术_A 云端_A 电子政务_A 移动支付_A 线上_A 信息产业_A 软件_A 信息基础设施_A 信息技术_A 数字生活_A 智能制造_B 智能化_B 智慧化_B 智慧城市_B 云计算_B 上云_B 云平台_B 云服务_B 大数据_B 数据安全_B 数据服务_B 数据治理_B 数据共享_B 工业互联网_B 物联网_B 区块链_B 机器人_B 5G_B 数字技术_B 数字化_B 数字经济_B
8 B8 q8 R- Z4 R) P1 b
+ v0 ?0 y5 \" m' Z4 a4.数据来源:地方政府工作报告/ L! k5 [2 a' u4 j: F
5.参考文献:7 K$ W; o3 a& G4 N
[1]金灿阳,徐蔼婷,邱可阳.中国省域数字经济发展水平测度及其空间关联研究[J].统计与信息论坛,2022,37(06):11-21.
% B6 A% r$ ^& r. O[1]陶长琪,丁煜.数字经济政策如何影响制造业企业创新——基于适宜性供给的视角[J].当代财经,2022(03):16-27.DOI:10.13676/j.cnki.cn36-1030/f.2022.03.001.
( v) ?0 g4 o) S0 d, p- t
0 X; [9 N8 D) A& F; I+ x |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x

|