您的位置：首页 > 社会 > 医疗卫生 > 医卫综合医卫综合

数据驱动的在线医疗服务质量影响因素研究（下）

作者：吴旭生，林天武，耿爽，段烈珍，王婕，马琰，唐雄伟来源：《卫生健康发展研究》（第二期）责任编辑：yangxu1985 2023-06-29 人已围观

首先，本研究抽取了预约人数排名前5的北京大学深圳医院、深圳市儿童医院、深圳市妇幼保健院、深圳市第二人民医院和深圳市人民医院10—12月份共282条医生回复记录作为人工编码集，剩下的交互数据则作为预测集。其次，在人工编码集中，医生的回复数据可以被分成两种类型，一种是有信息提供行为的编码为1，另一种是无信息提供行为的编码为0，并根据Roter等人（2002）所提出的相互作用分析系统，将医生提供的诊疗意见（包括生活作息、睡眠要求、药物量、就医时间、报告要求）和诊断结果（包括健康状况信息）视为医生在交互过程中的信息提供行为[22]。为提高数据标注的准确性，本研究邀请了一位南方医科大学的医学生来协助标记研究样本，并在标记之前向其阐明注释规则。然后，样本标注完成后，使用Python软件中的Jieba库对样本数据进行分割。Jieba分词作为一款中文开源分词包，使用率高，并且具有高性能、高准确率、强可扩展性等特点。为进一步提高分词准确性，本研究在Jieba中载入了自定义的搜狗医疗词汇相关词典，以获取更高质量的数据分词结果，并导入哈工大停用词词典作为外部参考来去除相关停用词。最后，使用TF-IDF（term frequency-inverse document frequency）来提取文本特征，并构建基于支持向量机算法（Support Vector Machine, SVM）的分类模型。使用训练好的分类器对预测集中的医生回复数据进行分类，识别信息提供行为，并根据预测结果计算医生在一次咨询期间信息提供行为的平均次数，以测量信息支持变量。

文本分类的评价指标和分类结果如表2、表3所示。其中本研究采用的评价指标包括准确率（precision）、召回率（recall）和F1值。

本研究根据医患交互过程中，单次咨询时医生提供情感关怀服务行为的平均次数来测量医生提供的情感支持。由于线上咨询过程中，医生提供情感关怀行为的次数很少，文本分类的效果不理想，因此本研究拟采取文本识别模式[4]的方法来识别医生所提供的情感关怀行为。首先根据Roter等人（2002）所提出的交互系统分析方法[22]在人工编码集中识别出医生的情感关怀行为，并总结出该行为的文本模式，如“没事”“别紧张”“别担心”等。然后，将医生回复数据分为两个类别，一类表示提供了情感关怀行为标注为1，另一类表示不存在情感关怀行为标注为0，对医患交互数据按照不同类别进行标注，以统计每位医生在咨询过程中提供的情感关怀行为频次。最后计算每位医生在单次咨询中提供情感关怀行为的平均数量作为医生提供情感支持的数量。

本研究以每位医生在单次咨询中回复字数的平均值来测量信息强度。测量过程中不考虑标点符号、英文字母和数字。此外，本研究还考虑到患者评价医生服务质量时，会受到医生个人信息的影响，包括医生的专业职位和医生的诊疗经验。医生的诊疗经验代表在线上平台预约过该医生进行就诊的总人数，可以通过预约人数来表示。医生的专业职位则代表医生在线下医院所取得的职级。由于健康160平台上出诊的医生必须具有线下医院的资格证明，因此医生在线上提供咨询服务的同时，还会具有线下医院所评定的个人职级，这对于患者在择医和评价服务时也是个很好的参考。在线上，医生的职级由低到高包括主治医师、副主任医师和主任医师，在分析过程中用数字1、2和3来分别表示。医生的诊疗经验体现了医生在医疗服务方面投入的时间、精力以及对于其专业领域的熟练度，医生的个人职级则体现了医生所具有的专业能力。在线上问诊结束后，患者个人感受和期望的差值均会影响其对于医疗服务的评价。

4.3 模型构建

由表4可知，所有医生样本总体服务质量水平的均值约为4.92，因此医生个人在线服务评价得分高于且等于4.92分的，将其服务水平划分为属于高质量服务类型，标记为1，医生个人在线服务评价得分低于4.92分的，将其服务水平划分为不属于高质量服务类型，标记为0。通过描述统计观察发现预约人数及信息强度的均值和标准差远大于其他变量，因此对这两个变量进行对数转换，分别记为Ln（预约人数）和Ln（信息强度），所有变量的描述统计如表5所示。并且全部自变量的膨胀因子检验（variance inflation factor）均小于3，即自变量之间不存在严重的多重共线性问题。