大数据在医疗保险欺诈检测中的应用分析

期刊: 健康文摘 DOI: PDF下载

计若潮

对外经济贸易大学 北京市 100105

摘要

随着大数据技术的发展和应用,医疗保险欺诈检测取得了新的突破。大数据支持下的医疗保险欺诈检测具有对海量数据快速抽样、分析和处理的能力,以提高保险欺诈信息的检测效率和精度。本研究先对医疗保险欺诈的场景进行了分类,进而利用大数据技术,通过挖掘医疗指标、患者行为、医疗服务提供者行为等数据,构建了医疗保险欺诈检测模型,目的是实现风险预警和及时干预。研究结果表明,应用大数据技术进行医疗保险欺诈分析能大幅提高检测率,降低医保基金支出风险,有助于推动医保行业健康发展。


关键词

大数据;医疗保险欺诈;数据挖掘;检测模型;风险预警

正文


引言

随着我国医疗保障制度的完善,医疗保障基金安全问题日益成为医保基金管理的难点和焦点。在利益驱动下,欺诈骗保、过度医疗等情况时有发生,危害医保基金的安全,损害了参保人的利益。由于参保人员就医总量巨大、医疗服务机构分布广泛、医保费用结算实时性强、医疗违规行为相对隐蔽,单靠人工检查、医保监管审核、人工飞检等工作难以做到全面覆盖、权威和公平,因此需要通过先进的大数据分析、人工智能等信息化手段,增强对医保基金、医疗费用、医疗服务行为的全流程、全链条审查监管能力。

1、大数据和医疗保险欺诈检测的基本理论和方法论

1.1 大数据的核心概念和技术内涵

大数据,作为现代信息技术的重要组成部分,其核心概念主要涉及到数据的体积、多样性、速度和价值四个V特征[1]。具体来说,体积是指数据量巨大,或者说数据规模超过了传统数据库的处理能力;多样性则是指数据类型多种多样,包括结构化数据、半结构化数据和非结构化数据;速度指的是数据产生和处理的速度非常快;而价值则是指通过分析处理大数据能够发掘出的潜在价值。

大数据的技术内涵涵盖了数据收集、存储、处理、分析和可视化等多个环节。其中,数据收集与存储是大数据处理的首要步骤,主要涉及到数据的采集、清洗、转换和存储等工作。数据处理技术主要对存储的数据进行预处理,通过数据抽取、转换和加载等操作为数据分析做准备。数据分析和可视化是大数据技术的核心应用,通过对大数据的深度挖掘和分析,可以发现数据中潜藏的模式、规律和价值,使得大数据不仅可以被人们理解,还可以被用于决策和指导[2]

1.2 医疗保险欺诈的场景

医疗保险欺诈,是指通过虚假信息、伪造病历或者瞒报真实情况等非法手段,骗取医保基金的行为。医疗保险欺诈的场景主要包括住院就医欺诈、门诊就医欺诈、医保药店欺诈、DRG/DIP支付方式欺诈等。

住院就医欺诈一般是参保人联合定点医疗机构,在住院就医过程中虚假填报就诊过程信息,骗取或套取医保基金的行为。比如低标准入院的情况,常见的欺诈行为包括住院体检、住院购药等。

门诊就医欺诈是指参保人在医院门诊就诊环节,通过虚构就医行为或违反限制开药等违法手段骗取或套取医保基金的行为。比如频繁结对门诊就医,不法分子通过一些活动非法收集大量老人的医保卡,再联合定点医疗机构虚构就诊记录骗取医保基金。

医保药店欺诈是指发生在医保药店购药场景的欺诈行为,常见的欺诈情况比如串换医保项目,定点医保药店将医保目录外的药品或耗材,串换为目录内可报销药品或耗材,或者将低价格药品或耗材串换为高价格药品或耗材等。

DRG/DIP支付方式欺诈是指在疾病分组打包付费的支付方式下,定点医疗机构在掌握一定医保分组结算的规律后,根据医保结算政策,通过填报与实际诊疗情况不符的诊断、手术等信息,让上报病例进入可获得更多医保基金补偿的分组等。

上述医保欺诈场景情况繁多,通过总结大量医保基金欺诈案例后,发现多数医保欺诈行为的发生都需要定点医疗机构或定点药店参与。并且每种情况根据场景不同,在就诊时间、频次、购药金额、医疗指标等数据上都会呈现一定的规律。根据欺诈行为发生的频率进行排序后,发现定点医疗机构相关的医保基金欺诈发生概率较高且涉及金额较大,对于社会造成的影响尤为严重。

1.3 大数据在医疗保险欺诈检测中的方法论

大数据在医疗保险欺诈检测中的应用主要体现在数据的采集、分析与预警模型的构建等三个环节。数据采集阶段依靠大数据技术可以实现医疗保险中涉及的各类数据的高速、全面的抓取和存储。这些数据包括患者的医疗记录、医生的处方、药店的销售记录、医疗服务提供者的行为数据等。其海量、综合的特性撑起了医疗保险欺诈检测的依据。

大数据分析阶段通过对采集的海量数据进行筛选、整理和统计,找出其中的异常数据、特征差异和模式变化,以发现可能的医疗保险欺诈行为。这主要依赖于大数据分析的多维度、多角度视图展现和深度挖掘能力。数据分析结果可为后续建立预警模型提供有用参考。

大数据技术在预警模型构建阶段则体现在算法模型选择和训练、模型测试及应用等阶段。大数据技术一方面可以利用传统的机器学习算法,如决策树、贝叶斯分类器等,一方面也可以利用深度学习、神经网络等新型方法来训练出能针对医疗保险欺诈进行精准预警的模型[3]

2、大数据技术在医疗保险欺诈监测中的应用

2.1 大数据技术对医疗保险欺诈检测的启示

大数据技术对医疗保险欺诈检测的启示是深远而广泛的。在医疗保险欺诈行为的识别和解析环节,大数据技术的引入提供了新的思路。

在数据收集阶段,大数据技术以其独特的海量数据处理能力,可以提取和捕捉到更为丰富、全面的信息,这包括以往难以获取的非结构化数据,如医疗图像、诊疗记录信息、医生对患者健康状况的评述等内容[4]。这些信息的有效结合,可以为后续的医疗保险欺诈分析提供更全面的数据支持。

在数据分析阶段,大数据技术利用其高效、精准的算法模型进行复杂数据的处理和分析。通过相关模型工具的使用,如关联分析、聚类分析、时序分析等,可以将零散和无形的医疗保险欺诈线索串联起来,为欺诈行为的发现和预警创造了可能。

在医疗保险欺诈预防及对策环节,大数据技术的应用带来了更加智能、更加人性化的解决方案。例如,基于数据分析的结果,可以构建自动化的保险欺诈预警系统,实现对潜在风险的预见及提前干预。也可以根据欺诈行为的模式特点,提供更有针对性的欺诈应对策略,从而更有效地防止医疗保险欺诈的发生。

大数据技术之所以能在医疗保险欺诈检测中发挥这么大的作用,一个不可忽视的原因是,大数据技术具有开放、透明、动态的属性,这使得医疗保险欺诈行为在隐藏、蒙混过关的也将自身暴露在无形的大数据扫描之下。大数据技术充分利用各类数据资源的价值,实现数据间的有效整合,为揭示保险欺诈行为提供了可能。这些启示对于今后增强医疗保险的管理效能,促进医保行业的健康发展都具有重要的参考价值。

2.2 大数据技术在医疗保险欺诈检测中的实践

在我国医疗保险体系的运行中,大数据技术发挥着越来越重要的作用。它在医疗保险欺诈检测领域的应用价值尤为突出,有助于维护医疗保险基金的安全和稳健运行。

首先,大数据技术在医疗保险数据的解读和分析上展现出强大的能力。这种技术能够迅速地对海量的医疗保险数据进行抽样、分析和处理,包括患者的基本信息、就诊记录、结算信息详情等多维度的数据。通过对这些数据进行高效处理和分析,我们可以对这些庞大的数据资源进行深度挖掘,找出隐藏在数据背后的医疗保险欺诈信息。[5]

其次,大数据技术有助于发现医疗保险欺诈行为。例如,通过对患者就诊历史和结算信息的深度挖掘,我们可以找出医疗过度、虚假单据等医疗保险欺诈行为。这种技术的应用,使得医疗保险欺诈行为无处藏身,有力地维护了医疗保险基金的安全。[6]

此外,大数据技术还可以实现对医疗保险欺诈的实时监控和预警。通过对医疗保险数据的实时分析,我们可以及时发现异常情况,如医疗机构的就诊量突然激增、某类药品的消耗量异常等。这些异常情况可能是医疗保险欺诈的线索,通过进一步调查,可以有效防止医疗保险基金的流失。

大数据技术在医疗保险欺诈检测中具有重要的实际运用价值。它不仅可以帮助我们挖掘医疗保险欺诈信息,还可以实现对医疗保险基金的实时监控,从而保障医疗保险体系的健康运行。随着大数据技术的发展和应用,我们相信在未来医疗保险欺诈检测领域将取得更为显著的成果。然而,大数据技术在医疗保险欺诈检测中的应用也面临一定的挑战,如数据隐私保护、数据质量提升等。这就需要我们在发挥大数据技术优势的同时,不断探索和完善相关法律法规,确保医疗保险欺诈检测工作的顺利进行。

2.3 医疗保险欺诈检测模型的构建

医疗保险欺诈检测模型的构建,是大数据技术在医疗保险欺诈检测中应用的重要一环。在模型构建的过程中,首要是挖掘出医疗指标、患者行为、医疗服务提供者行为等关键特征数据,并通过数据预处理和清洗,保证数据的准确性和完整性,提高模型精度。

本次研究按照医疗保险欺诈发生概率较高的低标准入院模型、频繁结队门诊模型为例进行模型构建设计。

低标准入院模型是指对不符合住院标准病例的住院治疗行为进行监测,主要为住院体检。针对此类情况,设计筛查逻辑如下:

1)统计一段时间医疗机构的住院数据的机构等级、性质及对应的药品费、检查费、总费用、住院日天数、总人次,计算基期数据

2)根据低标准住院的特点,定义A市低标准入院指数。主要通过使用经验确定法、客观确定法以及客观加经验法,确定费用系数的权重、平均住院日系数的权重、检查费用占比系数的权重,从而获得该市的不同等级医疗机构的低标准入院指数(LSII1,体检式)。

3)使用LSII模型筛选出LSII大于4(阈值暂定为4,后期依据实际数据调整此阈值)的风险病例。

4)对筛选出的风险病例,按照检查费占比>=75%(阈值暂定,后期可依据数据情况调整)定义为低标入院高风险病例

5)根据数据情况设计排除条件。

频繁结队门诊模型用于发现患者频繁结队同时门诊,即多人多次同时空出现的情况,如盗刷医保卡,诱导门诊等行为。针对此类情况,设计筛查逻辑如下:

1)筛查统筹区内特殊人群门诊数据:如退休职工、在职职工等门诊报销比例较高的特殊人群。

2)使用关联挖掘算法,按每月进行模型运算,筛查特殊人群结队门诊情况,高于阈值为高风险病例。具体阈值视模型结果及综合考虑门诊场景进行调整。

3)根据数据情况设计排除条件。

3、基于大数据的医疗保险欺诈检测研究展望

3.1 面向大数据的医疗保险欺诈技术发展趋势

在技术手段上,将传统的关联规则、逻辑回归等数据挖掘方法与机器学习、深度学习等先进技术相结合,既可以提取出医疗保险欺诈的隐藏模式,又可以通过训练得到高准确度的检测模型。尤其是深度学习,其可以进行复杂的计算和处理,挖掘数据背后的深层关系,为识别欺诈行为提供强大的支持。

在数据类型上,大数据技术不仅能处理结构化的医疗数据,还可以处理非结构化的信息,如医疗记录、患者反馈等,这为全面、深入地理解和识别欺诈行为提供了可能。硬件技术的革新——如分布式存储和计算技术,可以支撑大规模的数据处理需求,极大地提升了数据分析的效率和准确度。但是,随着各种应用场景的不断涌现,如何有效地处理和分析多源异构数据,提取有用信息,仍是大数据应用中所面临的主要挑战之一。

在应用场景上,随着5G、区块链、云计算等新技术的日益成熟,医疗保险欺诈检测将可能形成联网、共享的大数据平台,实现各定点医疗机构、定点药店的数据协同,不仅提升了数据的使用价值,也有利于减少信息孤岛,提高医疗保险欺诈的检测率。

3.2 大数据在医疗保险欺诈检测中的未来挑战

大数据在医疗保险欺诈检测中的应用虽然带来了显著的优点,但是也存在一些挑战。首当其冲的就是数据的安全性和隐私保护问题。医疗数据中包含大量的个人隐私信息,如何在利用这些数据进行欺诈检测的保障数据主体的隐私权益,是一个亟待解决的问题。医疗保险欺诈检测需要处理大量异构数据,数据质量和数据一致性的保证也是一大挑战。

噪声和异常值的处理也是一个挑战。医疗保险数据中可能存在大量噪声和异常值,如何有效识别和处理这些噪声和异常值,对于提高欺诈检测的准确率十分关键,但也是具有挑战性的一项工作。并且,尽管大数据可以提供丰富的信息,但是海量的数据可能造成信息过载,使得挖掘有效信息变得十分困难。

大数据分析的复杂性也不容忽视,特别是医疗保险欺诈检测通常涉及到多个相关的数据源。而如何从这些数据源中选择和组合适当的大数据分析策略,是一个复杂而具有挑战性的任务。尤其是在处理大数据时,传统的数据分析模型和算法可能并不适合,需要开发新的分析模型和算法,也是一个巨大的挑战。

对于医疗保险欺诈检测的成功实施,需要相关领域专家的理解和支持,故跨学科交流和合作也是面临的一大挑战。未来通过研究和探索,对以上挑战做出有效的应对,以提升大数据在医疗保险欺诈检测中的实用性和有效性[7]

3.3 推动大数据在医疗保险欺诈检测中的实践应用和研究创新

在实践应用上,虽然大数据的引入已经显著提高了医疗保险欺诈检测的效率和效果,但如何更好地利用大数据,进一步优化检测流程并且提高检测精度,仍然是值得关注的重要问题。例如,可以开发更高效的数据处理和分析算法,以处理和分析更多的数据,亦或是研发更合适的医疗保险欺诈特征识别技术,以引导数据分析的重点和方向。

对于研究创新,则需要通过学术研究和实证研究,探索医疗保险欺诈的新型表现形式以及新型检测策略。例如,通过深入研究医疗保险欺诈的规律和特性,可能能发现一些以前未被关注的新型欺诈手段。借助于人工智能等新兴技术,有可能在检测手段上进行创新,从而大幅提升检测效果。

结束语

本研究通过深度探讨了大数据在医疗保险欺诈检测中的应用,首先对医疗保险欺诈的场景进行分类,然后通过挖掘医疗指标、患者行为、医疗服务提供者行为等多维度数据,构建了应用大数据技术的医疗保险欺诈检测模型,有效实现了早期预警和及时干预。实证结果显示,应用大数据技术进行医疗保险欺诈分析能显著提升检测率,显著降低医保基金的经济损失。然而,应明确的是,尽管本研究取得了一定成果,但大数据在医疗保险欺诈检测中的应用仍存在一定局限性,例如:数据采集和处理的难度、模型的准确性等问题。此外,医疗保险欺诈的形式多样,动态变化,需要我们持续跟进研究,并不断优化和升级医疗保险欺诈检测的方法和模型。总的来看,大数据技术在医疗保险欺诈检测领域有广阔的应用前景和深挖空间,需要我们进行更深入和系统的研究。

 

参考文献

[1]焦建华.大数据时代医疗保险基金监管创新分析[J].乡镇企业导报,2019,(02).

[2]许林菁.医疗保险行业大数据审计应用探讨[J].合作经济与科技,2022,(03).

[3]曹鲁慧,秦丰林,闫中敏.基于TLSTM的医疗保险欺诈检测[J].计算机工程与应用,2020,56(21).

[4]吴恒亮,于本海,翟宇翔,张巍巍.大数据环境下医疗保险欺诈审计实施路径研究[J].财会月刊,2019,0(24).

[5]刘立安詹长春.大数据背景下医疗保险诚信体系构建[J].中国集体经济,2020,(34).

[6]谭开龙邱志勇."互联网+"与大数据在医疗保险中的应用[J].信息技术与信息化,2019,0(09).

[7]李洁.大数据在医疗保险中的应用[J].环球市场,2019,(28).

 


...


阅读全文