2024年中国的创新突破度数据换算成了cd 指数

把2006年到2024年中国的创新突破度数据换算成了CD指数。参照《经济研究》的王雄元老师的方法,这个CD指数可以用来反映一家企业创新突破的程度。具体来说,就是把这家企业一年里各项专利的CD指数算个平均值。我们还用了一篇论文里的模型,通过看专利之间引用模式的不同,来衡量它的突破性。 第一步,先算出某项专利被引用一次时的突破程度CD1指数。如果专利j引用了专利i,这就给f_i,t记1分,不然就是0分;如果专利j还引用了专利i之后的那些后向引用专利,那就给b_i,t也记1分,不然也是0分。要是后来的专利既引用了专利i又引用了它后面的那些,那专利i的这项引用CD1指数就是-1;要是后来的专利只引用专利i没引用后面的,那专利i的这项引用CD1指数就是1。 第二步,把每项专利综合起来算它的突破程度CD2指数。因为专利i可能被很多项专利引用,所以把每项引用的CD1指数按照被引用数量的权重取个平均值,这就是CD2指数了。 第三步,再把企业所有专利的综合突破程度算出来。每个企业可能有很多项专利,把当年度拥有的每项专利的CD2指数按照专利数量的权重取个平均值,就是这家企业当年度的CD指数。理论上说,这个指数的取值在-1到1之间,数值越大说明创新突破度越高。 这次搜集的数据范围很大,有842个样本和34个省份,包括了香港、澳门和台湾省。资料包里有原始数据、计算代码、计算过程的截图和最终结果,大家可以自己验证一下看对不对。参考文献是王雄元和秦江缘发表在《经济研究》上的那篇文章。