您的位置:首页 > 社会 > 医疗卫生 > 医卫综合 医卫综合
大数据时代下医院统计信息数据分析中的研究热点与可视化分析
作者:深圳市卫生健康发展研究和数据管理中心 来源:深圳市卫生健康发展研究(第一期) 责任编辑:manman 2023-01-04 人已围观
摘要:目的 利用文献计量学方法分析 2005 年 -2021 年间大数据背景下国内外医院统计信息数据分析的应用现状和前沿热点,以期为医院数据统计领域研究和医院管理方面提供借鉴。方法 本文通过检索 Web of Science、中国知网、维普、万方数据库,获取 2005 年以来国内外医院统计信息大数据分析方面的文献相关信息,并运用信息可视化软件 VOSviewer 绘制知识图谱。结果 一共纳入文献 1956 篇,其中英文期刊633 篇,中文期刊 1323 篇。国外相关文献呈逐年增长趋势且具有相关性(P<0.05),主要研究内容为大数据建模、流行病学研究、医院疾病病种相关分析和肿瘤相关研究 4 个方面;国内相关文献近几年呈现下降趋势,主要研究包括 8 个主题。国外研究成果以研究型为主,偏向统计学方法和大数据研究;我国研究成果以管理型居多,研究主题涉及统计工作、医院信息化、统计管理、统计信息等方面。结论 目前大数据背景下医院统计数据分析的研究成果算丰富,但从总体趋势上来看,我国相关研究呈现下降趋势,与国外存在一定差距。随着信息化、大数据分析等前沿技术的快速发展,我国医院统计数据分析应借鉴创新技术加强多方协作和资源整合,为促进医疗信息化发展和医院管理决策提供有力的支持。
关键词:商业智能;医院统计;数据分析;文献计量学;可视化分析
Abstract: Objective To analyze the application status and frontier hot spots of hospital statistical information data analysis at home and abroad under the background of big data from 2005 to 2021 by using bibliometric methods, in order to provide reference for the research in the field of hospital data statistics and hospital management. Methods By searching the databases of web of science, CNKI, VIP and Wanfang, this paper obtained the literature related information on big data analysis of hospital statistical information at home and abroad since 2005, and used the information visualization software VOSviewer to draw the knowledge map. Result A total of 1956 literatures were included, including 633 English journals and 1323 Chinese journals. The relevant foreign literature has increased year by year and has correlation (P < 0.05). The main research contents include big data modeling, epidemiological research, hospital disease type correlation analysis and tumor correlation research; The relevant domestic literature has shown a downward trend in recent years, and the main research includes 8 topics. Foreign research results are mainly research-based, biased towards statistical methods and big data research; Most of the research results in China are management oriented, and the research topics involve statistical work, hospital informatization, statistical management, statistical information and so on. Conclusion The research results of hospital statistical data analysis under the
background of big data are rich, but in terms of the overall trend, the relevant research in China shows a downward trend, and there is a certain gap with foreign countries. With the rapid development of cutting-edge technologies such as informatization and big data analysis, China's hospital statistical data analysis should learn from innovative technologies, strengthen multi-party cooperation and resource integration, and provide strong support for promoting the development of medical informatization and hospital management decision-making.
Keywords: Business intelligence; Hospital statistics; Data analysis; Bibliometrics;Visual analysis
2021 年是我国“十四五”规划的开局之年,国家卫生健康委员会将通过继续开展新一轮医院等级评审等活动不断深化公立医院改革和逐渐推进现代医院管理制度的建设,医疗领域将迎来大数据时代。大数据分析(Big Data Analysis)是将原始粗糙的数据转化成有用、有意义的信息,并将数据收集、组织、分析,提供具可操作性的决策支持和战略上的理论、流程、方法、技术 [1]。大数据包括数据可视化、数据挖掘(Data Mining)、联机分析处理(Online Analytical Processing)等,近年来这些技术被越来越多地研究应用于医疗领域 [2],以提高管理运行效率和医疗质量。目前,大数据分析在医疗行业的应用被看成有效的利用,通过收集分析医疗机构中大量的数据,致力于知识发现、数据挖掘,从而实现深层次服务,为医院领导层的决策提供可以参考和准确清晰的数据依据,也大大地提高医疗统计质量 [3]。当前,国内外在医院统计大数据信息分析中的研究成果丰富,但是运用文献计量学方法分析研究的文献较少;本文在既有研究的基础之上,通过梳理现有文献,并运用 VOSviewer 软件对 2005 年以来国内外大数据背景下医院统计信息数据分析的研究文献进行计量学研究,以系统分析其研究发展历程及热点趋向,为医院统计信息化深入研究和医院管理能力的提升提供借鉴。
1 资料与方法
1.1 文献来源和检索方式
本次研究文献数据来源于 Web of Science、维普、中国知网和万方数据库;检索条件:① Web of Science 数据库检索表达式:Data analysis(标题)and inhospital(标题),时间跨度:(2005-01-01—2021-11-02)。②三大中文数据库主题 =“医院统计信息化”or“医院统计数据商业智能”or“医院信息智能化”or“医院统计 BI”or“公立医院 BI 医院统计”;选择精确匹配检索,检索时间:(2005-01-01—2021-11-02);文献类型限定为“期刊”。检索后获得文献 1956 篇,其中英文期刊 633 篇,中文期刊 1323 篇。每条题录包括机构、作者、关键词、摘要、期(卷)、发表年份及参考文献等。
1.2 研究方法
本文采用 EndNote 软件和 VOSviewer 软件作为研究基础。首先中文文献利用CNKI 检索主体文献,检索出 1323 篇,导出以 .txt 格式保存,利用 EndNote 软件对文献进行格式转换导出,最后使用 VOSviewer 软件对中文文献进行可视化分析,绘制核心作者发文合作图谱、主要关键词平均出现时间 Overlay 视图和主要关键词聚类图,深入研究国内外大数据背景下医院统计数据分析研究成果的年度分布、作者及机构关系、学科分布和关键词,展现大数据背景下医院统计数据分析领域的前沿和研究热点。
2 结果
2.1 国外大数据背景下医院统计数据前沿热点和研究现状分析
2.1.1 时间分布及趋势分析
2005 年—2021 年,有关大数据背景下医院统计数据分析的研究文献数量总体呈波动增长。最近三年达到最多,分别为 66 篇、78 篇。同时,相关预测模型显示:国外大数据背景下医院统计数据分析研究发文量与年份之间存在显著的相关性,相关系数比较高(R2=0.9367),可得出未来国外大数据背景下医院统计数据分析领域将会持续受到全球研究者的关注,且发文量持续增长。见图 1。

▲图 1 2005 年—2021 年国外大数据背景下医院统计数据分析研究文献时间分布图
2.1.2 核心作者聚类分析
高 产 作 者 排 名 并 列 第 一 的 为 Hernandez-barrera 和 Jimenez-garcia。 表1 为 2005 年—2021 年国外大数据背景下医院统计数据分析研究领域发文量位 列 前 10 的 作 者、 发 文 量 和 占 比。 根 据 文 献 计 量 学 普 赖 斯(Price) 定 律[4]:MP=0.749 √ NPmax=0.749× √ 10=2.369。 其 中,MP 代 表 核 心 作 者最低发文量,Npmax 代表发文最多作者论文数,发表 4 篇及以上论文的作者可被认定为核心作者 [5]。图 2 是基于 VOSviewer 的核心作者合作网络图,图中节点代表作者,节点大小代表作者发文量,节点之间的联系代表作者之间的合作强度,合作密切的作者用相似颜色呈现;各研究团队内部合作紧密,但团队间缺乏交流和合作。

▲表 1 2005 年—2021 年国外大数据背景下医院统计数据分析研究领域发文量前 10 位作者情况

▲图 2 国外大数据背景下医院统计数据分析研究核心作者合作网络图
2.1.3 期刊来源分析
本次纳入研究的 633 篇文献,共发表于 371 种期刊上;其中,前 12 位的期刊载文量占总数的 19.59%;载文量前 12 位的期刊中,有一种为北大中文核心期刊,其余均为国际期刊,排名第一的期刊为 Value in Health,总数为 21 篇。见图 3。

▲图 3 国外大数据背景下医院统计数据分析研究前 12 来源期刊
2.1.4 关键词分布与聚类分析
主要关键词能在一定范围内反映该领域的研究热点或重点,对主要关键词进行聚类分析,将更为直观地反映某一领域的研究热点和研究方向 [6]。基于VOSviewer 对纳入的 633 篇文献进行关键词聚类研究,其中,出现频次 10 次及以上的 160 个关键词形成 4 个聚类,出现频次前四位的关键词为“age”“model”“outcome”“diagnosis”,意味着国外大数据背景下医院统计数据分析主要涉及 4 个主题:大数据模型研究、医院病种与数据分析、流行病学与大数据研究、肿瘤与大数据。结合每个聚类下内部高频次分析如下,见图 4。

▲图 4 国外大数据背景下医院统计数据分析研究主要关键词聚类图谱
(1)大数据模型研究。“model”“efficiency”“quality”为高频词,代表性研究人员有 Barpanda、Lee 等。Barpanda[7] 随机抽取 20 家医院,利用数据包络分析法(DEA)进行医院绩效分析,从而对每家医院的绩效进行测量,旨在找出医院绩效投入和产出变量之间的关系。Lee[8] 等用“双倍法”(DID)有效地应对数据泄露对医院运营的影响,旨在提高医院生产力,能够有效地抵御数据泄露带来的冲击,得出医疗工作者应该积极地接受网络安全方面的培训,以减少干扰。Rezaee[9] 等用多群数据包络分析法建立模型,对抽取的 288 家医院进行分组评估,旨在研究地理位置对医院产生的影响。由此可见,大数据建模对医院发展方向,特别是绩效模块有着非常大的影响。
(2)医院病种与数据分析。“age”“risk factor”“higher risk”为高频词,代表性研究人员有 Grytten、Guohong Cui、Eberlein-Gonska 等。该主题的研究路径之一是通过数据横断面研究,用时间序列分析医院不同病种的关系,为医院临床病种的决策提供参考意义。Grytten[10] 等从经济和医学角度对剖腹产数量的增加超过了医疗风险因素的预期进行了其他解释,即医院收入的增加仅解释了挪威过去30 年中剖腹产率增加的一小部分。仅根据医院收入的增长,剖腹产率的增长远远超过预期,这是通过使用医院的固定效应(一个滞后的收入变量)以及包括母亲和婴儿风险因素的一组广泛的控制变量来实现的。Guohong Cui[11] 等对脑出血和冠心病在人群中的分布和危险因素进行分析,用回顾性分析法得出性别、年龄、吸烟等多种危险因素是两种疾病的引起原因,同时影响因素之间存在显著差异。Eberlein-Gonska[12] 等使用描述性技术和逻辑回归模型确定褥疮的患病率和发病率以及与褥疮相关的人口统计学和疾病相关的危险因素。根据每个发生褥疮的患者需要记录的额外患者数量,计算在各种护理方案中记录褥疮的努力受益比。得出各临床护理单位在褥疮风险方面存在重大差异,对常规质量管理数据的流行病学分析有助于评估医疗保健措施的效益,持续的评估至关重要。
(3)流行病学与大数据研究。“epidemiology”“death”“frequency”为高频词,代表性研究人员有 Flem、Deshmukh、Grammatico 等。Flem[13] 等用回顾性统计学分析方法评估了轮状病毒的发病率,以此来评估轮状病毒疾病的全部负担及其在挪威的经济影响。Deshmukh[14] 等采用时序列回归分析方法得出钩端螺旋体病的描述流行病学和气候决定因素,该月的相对湿度和上月的降雨量是钩端螺旋体病的重要决定因素。Grammatico[15] 利用医院数据库和特定病历定义,对脊椎骨髓炎(VO)进行全国性检测。报告的主要传染源为葡萄球菌(38%)和结核分枝杆菌(31%);最常见的合并症为败血症(27%)和心内膜炎(9%);对 90 份病历的回顾证实 94% 的病例诊断为 VO。
(4)肿瘤与大数据。“cancer”“cancer registry data”“odd”为高频词,代表性研究人员有 Atique,Tsukada 等。Atique[16] 等提供某医院肿瘤登记处的癌症分布模式,并与其他国家研究的模式进行比较。得出在两性中,最常见的恶性肿瘤是白血病,这与其他研究相反,表明这可能与该国该地区广泛使用农药和其他农用化学品有关。Tsukada[17] 等通过 2008 年—2011 年间大数据分析调查日本不同患者数量的指定癌症治疗医院中,患者的分期和年龄分布检验是否存在差异。结果得出与日本低容量医院相比,高容量医院的早期癌症患者和年轻患者比例更高,进行容量结果研究的研究人员和分析医院绩效的决策者在进行医院间比较时应谨慎。
2.1.5 新兴主题分析
利 用 VOSviewer 的 Overlay 视 图, 对 主 要 关 键 词 生 成 时 间 网 络 图。 其中,图中节点表示关键词,新出现的高频关键词可以反映新兴的研究主题,见图 5。“cancer registry data”“Japan”“primary outcome”“physician”“secondary dataanalysis”“patients”等关键词是近年来国外大数据背景下医院统计数据分析领域研究的新兴主体。

▲图 5 国外大数据背景下医院统计数据分析研究主要关键词平均出现时间 Overlay 视图
2.2 我国大数据背景下医院统计数据分析研究现状与热点前沿分析
2.2.1 时间分布
由图 6 可见,2005 年—2021 年大数据背景下医院统计数据分析的研究成果整体呈波动趋势,2005 年—2008 年之间研究较多,2017 年也出现一次高峰,随后下降。

▲图 6 2005 年—2021 年我国大数据背景下医院统计数据分析研究文献时间分布图
2.2.2 作者及研究机构分布
高产作者排名第一的是来自新疆医科大学第五附属医院的郭建新(15 篇),见表 2;前 12 位高产作者中,有 3 位来自四川省。根据文献计量学普赖斯定律 [4]得出核心作者最低发文量为 2.901,按照取整原则,即发表 3 篇及以上论文的学者可被认定为核心作者,图 7 为核心作者合作网络图,114 位核心作者中,仅有 7位作者之间有合作关系,并形成 2 个合作团队。

▲表 2 2005—2021 年国内大数据背景下医院统计数据分析发文量前 12 位作者情况

▲图 7 2005 年—2021 年我国大数据背景下医院统计数据分析研究核心作者合作网络图
2.2.3 期刊来源分布
纳入本文的 1323 篇文献,前 10 位的期刊载文量占纳入总文献数目的43.39%,排名第一的为《中国医院统计》,仅 1 本为中文核心期刊。见图 8。

▲图 8 2005 年—2021 年我国大数据背景下医院统计数据分析研究载文量前 10 来源期刊
2.2.4 主要关键词分布与聚类分析
利用 VOSviewer 工具对出现频次≥ 10 次的高频关键词进行聚类分析,我国大数据背景下医院统计数据分析研究文献主体聚类网络图谱如图 9 所示。共生成8 个颜色不同的类群,每个类群代表一个研究主题,类群之间关系形成了研究主体的知识网络,说明大数据背景下我国医院统计数据分析主要涉及 8 个主题:
主题 1:医院信息系统和数字化医院。包括对策、数据质量以及病案统计和统计报表,重点研究大数据背景下数字化医院统计工作方法和影响因素等 [18,19];
主题 2:业务收入与门诊人次。主要探究医院统计信息在医院财务统计分析中的运用,医院统计工作在绩效考核中的管理和应用 [20,21];
主题 3:医院统计和统计学方法。包括医院统计信息化、大数据下医院统计模式的改革、新型统计学方法的应用和网络连接化 [22,23];
主题 4:大数据时代下的医院统计信息管理和统计工作的重要性 [24,25];
主题 5:医院统计指标体系和统计方法,病案首页及管理 [26,27];
主题 6:医院统计信息及其数据挖掘方面,信息化的网络环境和服务 [28,29];
主题 7:医疗质量的评价,计算机网络技术在医院统计管理中的运用和分析
主题 8:医院管理和统计信息及管理,大数据下统计信息的作用 [32]。

▲图 9 2005 年—2021 年我国大数据背景下医院统计数据分析研究主要关键词聚类图谱
2.2.5 国内新兴主体分析
选择 VOSviewer 的 Overlay 视图,对主要关键词生成时间网络图,具体见图10。“医院”“统计工作”“大数据时代”“统计管理”“信息化”“统计信息管理”“措施”“重要性”等关键词是近年来国内大数据背景下医院统计数据分析研究领域的新兴主题。
3 讨论
在研究热点方面,近 15 年国内外大数据背景下医院统计数据分析研究热点相对吻合但是又各有侧重。国外研究成果以研究型为主,主要研究内容为建模、流行病学研究、医院病种研究和肿瘤相关;而我国研究成果以管理型居多,研究型较少,研究主题广泛,涉及统计工作、医院信息化、统计管理、统计信息等方面。从国内载文量前 10 的期刊来看,长期刊登医院统计数据分析的相关文献的期刊层级不高,这一方面应该借鉴国外最新研究方法,创新研究思维,提高研究质量水平,推进国内医院统计数据的深入研究。从合作网络及核心作者来看,相对高产作者较少,合作团队也不多,为此,要加强国内学术团体之间以及国际团体间数据分析研究的交流和合作。
在研究前沿趋势方面,近 15 年国内外大数据背景下医院统计数据分析领域的研究热点在逐渐变化。国外研究比较多,并随着年份增加呈现增长趋势;国内近几年相关研究呈现下降趋势,且研究质量欠突破。目前,统计信息系统的改进和数字化医院成为研究的新趋势。由于缺少多学科交叉背景的专业人才队伍和研究资金的缺失,我国医院统计数据分析研究在发展水平上与国外存在一定差距。为此,在信息化、大数据分析等前沿技术快速发展的背景下,医院统计数据分析研究一方面要建立起规范化的标准体系,提高核心技术水平;另一方面,要加强多方协作和资源整合,实现资源、人才的流通,搭建好统计分析与医院数据分析互通的桥梁,为促进医疗信息化发展和医院管理决策提供有力的支持。

▲图 10 2005 年—2021 年我国大数据背景下医院统计数据分析研究主要关键词 Overlay 视图
参考文献
[1] 张会会,马敬东,邸金平 . 商业智能在医疗卫生领域的应用 [J]. 中国卫生信息管理杂志,2014,11(3): 255-259.
[2]VANNI AGNOLETTI, MATTEO BUCCIOLI, EMANUELE PADOVANI. Operating roomdata management: improving effifi ciency and safety in a surgical block[J]. BMC Surgery, 2013,13(7): 1-12.
[3] 张帆,李浪,廖宁,等.大数据时代背景下医院统计工作模式改进的探讨 [J].中国卫生信息管理杂志,2016,13 (6): 635-638.
[4] 宗淑萍 . 基于普赖斯定律和综合指数法的核心著者测评——以《中国科技期刊研究》为例 [J]. 中国科技期刊研究,2016,27(12): 1310-1314.
[5] 杨敬宇,钱亚玲,王韵华 . 新医改背景下国内疾病诊断相关分组研究现状与热点文献计量学与可视化分析 [J]. 现代预防医学,2021,48(9): 1631-1634.
[6] 万美蠲,宋洋,孙兴兰,等 . 国外居家医疗研究热点与前沿分析 [J]. 中国全科医学,2020,23(12): 1465-1472.
[7] BARPANDA, DR. SASWAT. Performance Analysis of Hospitals in Kerala Using DataEnvelopment Analysis Model[J]. JOURNAL OF HEALTH MANAGEMENT, 2020, 22(1):25-40.
[8] LEE, JINHYUNG, CHOI. Hospital Productivity After Data Breaches: Difference-inDifferences Analysis[J]. JOURNAL OF MEDICAL INTERNET RESEARCH, 2021, 23(7):e26157.
[9]REZAEE, MUSTAFA JAHANGOSHAI, KARIMDADI. Do Geographical Locations Affectin Hospitals Performance? A Multi-group Data Envelopment Analysis[J]. JOURNAL OFMEDICAL SYSTEMS, 2015, 39(9): 85.
[10]GRYTTEN, JOSTEIN, MONKERUD, et al. The impact of hospital revenue on the increase in Caesarean sections in Norway. A panel data analysis of hospitals 1976-2005[J]. BMCHEALTH SERVICES RESEARCH, 2011, 10(12): 267.
[11]GUOHONG CUI, YANFEN ZHANG, WEIJUN TONG. Risk factors for intracerebral hemorrhage and coronary heart diseases over a 3-year period in patients admitted to some hospitals of Tongliao city of Nei Monggol Autonomous Region Retrospective analysis on case data[J]. Neural Regeneration Research, 2007, 2(9): 569-573.
[12]EBERLEIN-GONSKA, MARIA, PETZOLD, et al. The Incidence and Determinants of Decubitus Ulcers in Hospital Care: An Analysis of Routine Quality Management Data at a University Hospital[J]. Deutsches Arzteblatt International, 2013, 110(33): 550-559.
[13]FLEM, ELMIRA, VAINIO, et al. Rotavirus gastroenteritis in Norway: Analysis of prospective surveillance and hospital registry data[J]. Scandinavian Journal of Infectious Diseases, 2009,41(10): 753-759.
[14]DESHMUKH, PRADEEP, NARANG, et al. Leptospirosis in Wardha District, Central India Analysis of hospital based surveillance data[J]. Clinical Epidemiology and Global Health, 2019,7(1): 102-106.
[15]GRAMMATICO L, BARON S, RUSCH E, et al. Epidemiology of vertebral osteomyelitis(VO) in France: analysis of hospital-discharge data 2002-2003[J]. Epidemiology and Infection,2008, 136(5): 653-660.
[16]ATIQUE, MUHAMMAD, LEGHAR, et al.Cancer Data Analysis in the Pathology Department, Combined Military Hospital, Multan, Pakistan 2002-2007[J]. Asian Pacific Journal of Cancer Prevention, 2008, 9(4): 679-681.
[17]TSUKADA, YOICHIRO, NAKAMURA, et al. Are hospitals in Japan with larger patient volume treating younger and earlier-stage cancer patients? An analysis of hospital-based cancer registry data in Japan[J]. Japanese Journal of Clinical Oncology, 2015, 45(8): 719-726.
[18] 冯健海 . 大数据背景下数字化医院统计工作方法分析 [J]. 统计与管理, 2021, 36(11): 33-37.
[19] 蒋素玲,孙渤星,邓志宇,等 . 大数据背景下四川省医院统计工作现状调查 [J]. 中国医院统计,2020,27(5): 455-459.
[20] 沈卿诚,陈雅珍,柏金喜 . 医院统计工作在绩效管理考核中的作用 [J]. 中国卫生信息管理杂志,2020,17(3): 397-400.
[21] 戴剑坤 . 探究医院统计信息在医院财务统计分析中的运用 [J]. 经济师,2021,(6):249-250.
[22] 芦怡 . 浅谈新形势下如何实现医院统计工作创新 [J]. 办公室业务,2021,(18): 92-93.
[23] 高上海 . 医院统计活动在整个医院管理中的价值分析 [J]. 财经界,2021,(26): 177-178.
[24] 沈丽华 . 运用大数据思维改进医院科室管理质量的方法和途径 [J]. 中医药管理杂志,2021,29(15): 164-165.
[25] 于丹阳 . 医院统计工作的必要性及统计质量提升路径 [J]. 中国储运,2021,(8): 186-187.
[26] 吴玉环 . 服务视角下医院统计工作面临的困境及对策初探 [J]. 中国卫生产业,2019,16(3): 59-60.
[27] 杨业春,贺嘉嘉,胡伟 . 互联网 + 医院信息统计工作的现状与对策 [J]. 中国医院统计,2020,27(5): 439-441,445.
[28] 赖伏虎,张铮,徐庆十,等 .“统计机器人”在医院统计领域的应用 [J]. 中国医院统计,2020,27(5): 476-480.
[29] 魏文玉 . 医院管理中医院统计信息的应用分析 [J]. 中国继续医学教育,2020,12(35):103-105.
[30] 汪娟,向宗城 . 计算机网络技术在医院统计管理中的运用 [J]. 软件,2020,41(12): 101-103.
[31] 吴敏 . 大数据时代下的医院统计信息安全管理研究 [J]. 江苏科技信息,2018,35(28): 18-20.
[32] 季伟 . 基于大数据时代的医院统计信息管理研究 [J]. 智库时代,2018,(20): 96-98.
本文作者:康敏 ,廖慧群 ,赖伏虎 ,石武祥
本文作者:康敏 ,廖慧群 ,赖伏虎 ,石武祥
很赞哦! ( )
评论
0