中医医院资源配置主成分-聚类分析
时间:2019-06-05 来源:中华名医传承网 点击率:351
中医医院资源配置主成分-聚类分析
湖北中医药大学 张盼 邓文萍
国务院 2016 年印发《中医药发展战略规划纲要(2016-2030 年)》提出“到 2030 年中医药服务领域实现全覆盖”,这对我国中医医院的发展提出了新的机遇和挑战。随着医疗卫生体制改革的不断深入,中医医院医疗资源作为中医卫生资源重要组成部分[1],中医医院如何抓住机遇,如何进行资源合理配置成为亟需解决的问题。本文将对 2002-2016 年中医医院资源
数据和 2016 年 31 个行政地区中医医院资源数据利用主成分-聚类模型进行年份和地区划分, 更好的了解我国中医医院资源现状,为“十三五”期间中医医院的进一步发展提供参考依据。
1 资料与方法
1.1 资料来源
本文所用数据来源于 2003-2017 年的《中国中医药年鉴》[2],31 个行政地区中医医院资源分布选取 2017 年《中国中医药年鉴》,并将这些数据进行归一标准化处理,形成近 14 年的
全国中医医院资源的年份分布数据和 2016 年地区分布,由于 2016 年《中国中医药年鉴》缺
失,故没有 2015 年数据。本文所指的中医医院不包含中西医结合医院和民族医院,研究指标有中医医院机构数、编制床位、室友床位、在岗职位数、卫生技术人员、执业医师以及药师
(士)等 18 个指标。
1.2 研究方法
利用 Excel 对《中国中医药年鉴》数据进行整理,形成中医医院资源时间和空间两个维度的分布数据。首先进行描述性统计分析,了解我国中医医院资源发展趋势,然后将数据导入 SPSS 软件进行主成分和聚类分析。主成分分析和聚类分析一起使用可以形成互补,从而避免出现分析不全面的情况[3]。
1.2.1 主成分分析
在研究关于多个变量的课题时,如果变量数过多,会影响课题的复杂性。影响中医医院发展的因素有很多,如编制床位、执业医师、注册师、药师等,在数据处理和分析过程中会涉及到许多指标变量,而且变量之间可能存在一定的相关性,数据反应的信息可能会有交叉, 因此利用主成分分析可以简化变量数量,用少数综合变量尽可能多的反映原来变量的信息, 从而简化数据分析。
主成分的原理就是使用降维的思想,用较少的变量来表示较多的数据信息,设法将原来众多具有一定相关性(比如 P 个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标,从而用线性关系来表示主成分和多个变量之间的变量关系。本文在聚类之前先对预处理后的数据进行主成分分析,达到降维的目的。
1.2.2 聚类分析
聚类分析是数据挖掘中一种常用的算法,它是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。本文主要利用 K-均值聚类和系统聚类方法将降维后的数据进行聚类分析,得到聚类结果。
2 结果
2.1 描述性分析结果
2016 年,我国中医医院机构数达 3462 个,较 2002 年增加了 970 个,增长 38.92%,年均
增长率为 2.38%。编制床位数达 785684 张,较 2002 年增加了 516862 张,年均增长率为 7.96%。
2002-2016 年间,我国中医医院病床与职工比例呈递减趋势,2016 年仅为 1:1.6。在岗职位数、卫生技术人员、执业(助理)医师、中医执业(助理)医师、注册护士、药师(士)的人数总体呈上升趋势,年均增长率分别为 6.160%、6.487%、5.209%、0.4095%、9.340%、2.398%, 注册护士人数增长速度最快,其次是卫生技术人员。详见表 1。
我国中医医院的机构数 2009 年之前呈平稳趋势, 2009 年以后中医医院机构数呈较快增长趋,2002-2016 年全国中医医院医疗机构数量增长情况如图 1 所示。中医医院编制床位数总体呈上升趋势,人均床位数持续增长,2016 年达到 0.568 张/千人,2002-2016 年全国中医医院人均床位数增长情况如图 2 所示。
表 1 2002-2016 年全国中医医院资源配置情况(名)
时间 |
在岗职位数 |
病床与职工比 例 |
卫生技术人员 |
中医执业 医师 |
中医执业助理医师 |
注册护士 |
药师 (士) |
2002 |
382977 |
1.55 |
309322 |
61136 |
6055 |
91898 |
40683 |
2003 |
396224 |
1.52 |
321236 |
61159 |
5751 |
95631 |
41699 |
2004 |
405889 |
1.48 |
329366 |
61286 |
5525 |
99497 |
41204 |
2005 |
415392 |
1.44 |
337492 |
61553 |
5286 |
103819 |
40293 |
2006 |
433576 |
1.43 |
352799 |
62773 |
5377 |
110085 |
41295 |
2007 |
461177 |
1.43 |
373846 |
66529 |
4813 |
121140 |
39679 |
2008 |
484804 |
1.38 |
396383 |
69233 |
4606 |
131668 |
40152 |
2009 |
518460 |
1.34 |
427853 |
74887 |
4696 |
148992 |
41112 |
2010 |
558110 |
1.32 |
462285 |
80519 |
4692 |
166755 |
42839 |
2011 |
662074 |
1.25 |
549875 |
89118 |
5402 |
205041 |
49067 |
2012 |
655925 |
1.20 |
549196 |
92678 |
5457 |
213526 |
46924 |
2013 |
713816 |
1.17 |
599114 |
100726 |
5894 |
241723 |
49665 |
2014 |
769166 |
1.16 |
646152 |
106617 |
5801 |
267493 |
52028 |
2016 |
884394 |
1.16 |
745725 |
124469 |
6411 |
320769 |
56685 |
年均增长率 (%) |
6.160 |
—— |
6.487 |
5.209 |
0.409 |
9.340 |
2.398 |
注:数据来源于 2003-2017 年《中国中医药统计年鉴》[2]
![]() |
图 1 2002-2016 年全国中医医院机构数量增长情况
图 2 2002-2016 年全国中医医院床位数增长情况
2.2 时间维度数据分析结果
2.2.1 年份数据主成分分析
将 2002-2016 年全国中医医院资源数据导入到 SPSS 软件中标准化后进行主成分分析。通过表 2 可以看出,经过主成分分析,第一个主成分的累积贡献率为 76.244%,第二个主成分的贡献率为 90.475%,前两个主成分的累计贡献率为 90.475%,前两个主成分的累积贡献率超过 90%,所以这 18 个指标变量可以使用这两个主成分来表示,这样达到降维的目的。同时,这两个主成分又能反映 90.475%的数据信息,所以主成分分析的效果比较好,采用这两个主成分来表示数据信息。
时间维度数据的主成分结果如表 3 所示。经过主成分分析后,降维后得到两个主成分, 主成分结果表示每年的第一主成分和第二主成分。
表 2 年份数据解释的总方差
成份 |
初始特征值 |
提取平方和载入 |
||||
合计 |
方差的 % |
累积 % |
合计 |
方差的 % |
累积 % |
|
1 |
14.486 |
76.244 |
76.244 |
14.486 |
76.244 |
76.244 |
2 |
2.704 |
14.231 |
90.475 |
2.704 |
14.231 |
90.475 |
3 |
.975 |
5.133 |
95.607 |
|
|
|
4 |
.507 |
2.670 |
98.277 |
|
|
|
5 |
.193 |
1.015 |
99.293 |
|
|