[2023]年度课题-11基于知识图谱的保险业医疗数据挖掘 与应用研究

课题编号:ISCKT2023-N-1-11 课题单位:中国人民保险集团股份有限公司 课题成员:刘云龙、马双梅、郑颖婧、张书涵、张安、王彦龙、李昊、谷禹翰

资源价格:0积分

  • 内容介绍

摘要

近年来,社会医疗保险体系收支压力日益增大,加之人口结构和疾病谱变化催生多样化健康保障需求,商业健康险在过去十年里经历了前所未有的发展机遇和战略窗口期。然而,自2017年以来业务增速从高点跌落,行业面临产品供需错配、企业核心能力不足等诸多困境。医疗数据作为客户所接受医疗服务与医疗支出的数据接口,是险企丰富产品供给、推进产服融合、提升精细化运营能力的重要支撑。但是,受限于医疗大数据的专业性、碎片化以及非结构等特征,价值发挥仍然十分有限。知识图谱技术在海量多元异构数据处理及复杂逻辑推理方面具有天然的技术优势,在智能搜索、产品推荐、智能客服、决策支持等领域得到广泛应用。现阶段,保险行业医疗知识图谱主要聚焦于公开的医学数据库和保险条款,主要用于辅助治疗、智能客服,但与核保、理赔核心业务协同不足。目前,基于险企自有非结构化核保、理赔材料,进行医疗图谱构建探索以实现核心业务支撑与赋能方面的研究较少。

本文聚焦保险行业医疗数据应用方面的系列问题、知识图谱构建技术及应用途径,一是细致梳理了当前健康险业务痛点,并针对数据基础建设支撑力度有限问题,深入探讨产品、运营及产服融合角度对医疗数据应用现状与挑战,充分论证险企强化知识治理及建设医疗知识图谱的必要性和重要性。二是结合商业健康险业务流程及医学知识特点,探索符合保险业务逻辑及医学专业逻辑的构建技术选型,并基于医疗知识图谱在医疗及保险领域的应用趋势分析,详细阐述了保险行业医疗知识图谱的构建重点与难点。三是针对商业健康险理赔业务特点,进行了医疗知识图谱的构建探索,并在智能问答场景进行了应用实践及评估分析,为知识图谱技术在商业健康保险领域的医疗数据分析实践提供重要的理论及实践参考。

不同于已有研究,本课题的创新之处主要体现在三个方面:

1. 针对健康险业务场景的知识特点及特殊需求,充分追踪与分析知识表示、知识抽取、知识融合以及评估构建等图谱构建技术领域最新研究进展,提出保险行业所适用的医疗知识图谱构建技术的选型建议。

2.深入剖析了知识图谱技术的问答系统和推荐系统在医疗与健康险领域的应用趋势,并围绕健康险业引入知识图谱技术的建设重点与难点进行了分析与探讨。

3.以医学文本、三目录信息以及保险企业自有理赔材料等知识源为基础,提出了保险医疗知识体系建设方案,并基于BERT-CRF方法实现了知识抽取,还引入了基于主动学习机制的关系抽取技术,完成了保险领域医疗知识图谱的构建,并对理赔风控智能提示及不合理用药/三目录智能问答场景进行了应用实践。

 


关键词

商业健康险,医疗数据应用,知识图谱构建,知识问答,智能理赔


Baidu
map