CN115631823A - 相似病例推荐方法及系统 - Google Patents
相似病例推荐方法及系统 Download PDFInfo
- Publication number
- CN115631823A CN115631823A CN202211077445.0A CN202211077445A CN115631823A CN 115631823 A CN115631823 A CN 115631823A CN 202211077445 A CN202211077445 A CN 202211077445A CN 115631823 A CN115631823 A CN 115631823A
- Authority
- CN
- China
- Prior art keywords
- symptom
- case
- cases
- similarity
- symptoms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 208000024891 symptom Diseases 0.000 claims abstract description 282
- 201000010099 disease Diseases 0.000 claims abstract description 98
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 98
- 238000003745 diagnosis Methods 0.000 claims abstract description 87
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 230000004927 fusion Effects 0.000 claims abstract description 3
- 238000010606 normalization Methods 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000013507 mapping Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000003058 natural language processing Methods 0.000 abstract description 6
- 238000004422 calculation algorithm Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 6
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 208000037919 acquired disease Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了相似病例推荐方法及系统,属于临床决策支持系统技术领域,本发明要解决的技术问题为运用深度学习算法和自然语言处理技术实现相似病例推荐的实现难度极大,可行性不高,采用的技术方案为:该方法具体如下:数据预处理:对病例入院记录电子病历的症状和诊断信息进行提取;并以病例为单位处理成标准症状和标准诊断列表,同时提取病例就诊时的就诊信息存储于字典,辅助后续获取病例相似程度;其中,就诊信息包括年龄及科室;获取症状权重:基于知识图谱的症状和疾病相关的知识,提取症状在疾病诊断中所占的权重;获取病例相似程度:根据目标病例的症状和诊断列表,并融合权重获取其他病例与目标病例的相似程度;相似病例推荐。
Description
技术领域
本发明涉及临床决策支持系统(Clinical Decision Support System,CDSS)技术领域,具体地说是一种相似病例推荐方法及系统。
背景技术
相似病例推荐属于推荐系统应用于在智慧医疗的一大突破,即通过向医生推荐与某一患者具有相同病情和症状的病例,辅助医生的临床诊疗。
目前众多相似病例推荐方法,大多是基于深度学习的人工智能算法,通过理解语义,计算余弦相似度等指标,用自然语言处理技术中计算文本相似度的方法来计算病例相似度。
然而运用深度学习算法和自然语言处理技术实现相似病例推荐的难度大,深度学习模型的可解释性不强,且需要临床医生对样本病例的相似性进行评估以获得训练样本,容易出现不同医生有不同评估意见的误差,因此训练样本的可靠性难以保证;且海量病例数据支撑是模型准确性的必要基础,而数据采集对一般企业和个人来而言非常困难,电子病历这种隐私性极强的个人数据尤其难以采集和处理;最后,深度学习模型对服务器等硬件配置有很高的要求,进一步加重了实现难度和实现成本。
综上,目前的相似病例推荐存在的问题为运用深度学习算法和自然语言处理技术实现相似病例推荐的实现难度极大,可行性不高。
发明内容
本发明的技术任务是提供一种相似病例推荐方法及系统,来解决基于深度学习和自然语言处理技术做相似病例推荐的实现难度大,可行性不高的问题。
本发明的技术任务是按以下方式实现的,一种相似病例推荐方法,该方法具体如下:
数据预处理:对病例入院记录电子病历的症状和诊断信息进行提取;并以病例为单位处理成标准症状和标准诊断列表,同时提取病例就诊时的就诊信息存储于字典,辅助后续获取病例相似程度;其中,就诊信息包括年龄及科室;
获取症状权重:基于知识图谱的症状和疾病相关的知识,提取症状在疾病诊断中所占的权重;
获取病例相似程度:根据目标病例的症状和诊断列表,并融合权重获取其他病例与目标病例的相似程度;
相似病例推荐:根据症状、诊断以及病例相似程度的计算结果,倒序排序得到相似程度由大到小的病例列表,并结合病例的年龄及科室的就诊信息,优先推荐相似程度高、同科室且同年龄段(0-6岁,6岁-18岁,18岁-60岁,60岁以上)的病例。
作为优选,数据预处理还包括对病例库所有病例的症状和诊断信息做归一化处理,具体如下:
以病例号为索引,获取病例库所有病例的症状列表和诊断列表于缓存;
根据知识图谱中的原词与归一词映射关系表,通过匹配原词名称与原词实体类型得到病例症状和诊断的归一词列表于缓存存储;其中,原词名称包括症状名称和/或诊断名称;原词实体类型包括症状和/或诊断。
作为优选,获取症状权重具体如下:
获取知识图谱中症状与疾病相关的数据,抽取知识类型(起始实体类型-关系-终止实体类型)为疾病-相关症状-症状的全部相关知识,存储于症状与疾病知识表中;
通过对知识图谱中症状-疾病的相关知识的提取,获取任一症状i所关联疾病的疾病数量Ni和知识库总的疾病数量N,从而计算症状权重。
更优地,通过对知识图谱中症状-疾病的相关知识的提取,获取任一症状i所关联疾病的疾病数量Ni和知识库总的疾病数量N,从而计算症状权重具体如下:
对起始实体的归一词做去重计数,即得到知识库总的疾病数量N;
对症状与疾病知识表中的终止实体归一词做去重提取,获得知识库的症状列表;
根据知识库的症状列表,依次去重提取每个症状i对应的起始实体归一词集合,通过计算起始实体归一词的数量,即可得到每个症状i关联疾病的疾病数量Ni;
根据知识库的症状列表和每个症状i关联疾病的疾病数量Ni,得到症状-权重字典,公式如下:
其中,Wi作为病例相似程度的症状系数;N-Ni表示该症状无关的疾病数量;N表示知识库总的疾病数量。
更优地,获取病例相似程度具体如下:
用目标病例的症状和诊断列表匹配病例库其他病例的症状和诊断列表,分别得到目标病例与其他病例的症状和诊断的交集集合;
根据目标病例与其他病例的症状的交集集合获取症状相似度;
根据目标病例与其他病例的诊断的交集集合获取诊断相似度;
将症状相似度和诊断相似度进行加权运算得到病例相似程度;
结合病例的基本信息,以病例号、年龄、科室、症状相似程度、诊断相似程度及病例相似程度为表头的表格形式存储于缓存之中。
更优地,症状相似度具体如下:
设被比较病例的症状列表为[i1,i2,i3…in];被比较病例与目标病例的症状交集集合为[i1,i2,i3…im];症状权重为Wi,则对应病例与目标病例的计算公式如下:
其中,S表示症状相似程度;Wi1+Wi2+Wi3+…+Wim表示症状交集集合的症状权重累加得到交集分数;n表示被比较病例的症状列表元素个数;
诊断相似度具体如下:
设被比较病例的诊断列表为[z1,z2,z3…zk];被比较病例与目标病例的诊断交集集合为[z1,z2,z3…zj];则对应病例与目标病例的症状相似程度计算公式如下:
其中,S′表示症状相似程度;j表示诊断交集集合的个数;k表示被比较病例的诊断列表元素个数;
病例相似程度是通过求取取症状相似程度S与诊断相似程度S’的平均值得到,公式如下:
其中,F表示病例相似程度。
一种相似病例推荐系统,该系统包括数据层和数据处理层;数据层包括病例库管理模块,数据处理层包括预处理模块、症状权重获取模块、病例相似度获取模块和相似病例推荐模块;
其中,病例库管理模块用于维护病例的基础信息、电子病历的结构化大段文本以及症状和诊断信息;
预处理模块用于对症状及诊断信息做归一化处理,并根据知识图谱的原词与归一词映射表,对病例库所有病例包括目标病例的症状和诊断信息做原词到归一词的映射,得到病例的标准症状和标准诊断信息并存储为列表形式;其中,归一化处理是依据知识图谱的原词与归一词映射关系表获取症状和诊断所对的归一词;
症状权重获取模块用于基于知识图谱里知识类型为疾病-相关症状-症状的相关知识,获取症状权重,并形成症状-权重字典;
病例相似度获取模块用于基于传入的病例库所有病例的症状和诊断列表以及症状权重字典,以目标病例的症状和诊断为比对标准,计算其余所有病例的症状相似程度、诊断相似程度和病例相似程度,以字典形式存储;
相似病例推荐模块用于根据症状、诊断以及病例相似程度的计算结果,倒序排序得到相似程度由大到小的病例列表,并结合病例的年龄及科室的就诊信息,优先推荐相似程度高、同科室且同年龄段(0-6岁,6岁-18岁,18岁-60岁,60岁以上)的病例。
作为优选,症状权重获取模块的工作过程具体如下:
(1)、获取知识图谱中症状与疾病相关的数据,抽取知识类型(起始实体类型-关系-终止实体类型)为疾病-相关症状-症状的全部相关知识;
(2)、对疾病-相关症状-症状的全部相关知识的起始实体归一词做去重计数,算得知识库总的疾病数量N;
(3)、对疾病-相关症状-症状的全部相关知识的终止实体归一词做去重提取,获得知识库的症状列表;
(4)、根据知识库的症状列表依次去重提取每个症状i对应的起始实体归一词集合,通过计算起始实体归一词的数量获得每个症状i关联疾病的疾病数量Ni;
(5)、对知识库的症状列表,依次根据所获取的每个症状关联的疾病数量Ni和所获取的总的疾病数量N,得到症状-权重字典,公式如下:
其中,Wi作为病例相似程度的症状系数;N-Ni表示该症状无关的疾病数量;N表示知识库总的疾病数量。
一种电子设备,包括:存储器和至少一个处理器;
其中,所述存储器上存储有计算机程序;
所述至少一个处理器执行所述存储器存储的计算机程序,使得所述至少一个处理器执行如上述的相似病例推荐方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如上所述的相似病例推荐方法。
本发明的相似病例推荐方法及系统具有以下优点:
(一)本发明通过将病例的症状与诊断信息归一化、融合症状权重计算病例相似度,使得相似病例推荐的准确性强且易于实现;
(二)本发明克服了基于深度学习和自然语言处理技术做相似病例推荐的实现难度大的缺点,通过比对病例的症状与诊断信息做相似程度的推理运算,并通过医疗知识图谱中症状与疾病的相关知识,引入症状权重的概念,融合到病例相似程度的计算之中,旨在提高罕见症状在相似性推理中的比重,在易于实现的同时,提高病例相似程度的计算准确性;
(三)本发明能够基于从目标病例的电子病历中提取的的症状和诊断信息,并融合症状在疾病诊断中所占的权重,推荐与目标病例相似的病例信息,辅助临床诊断与临床决策;
(四)考虑到病例在症状上的相似程度不仅与匹配上症状数量有关,也与匹配上的症状罕见程度有关,因此本发明加入症状权重的概念以提高下一步计算症状相似程度的准确性。
附图说明
下面结合附图对本发明进一步说明。
附图1为相似病例推荐方法的流程框图。
具体实施方式
参照说明书附图和具体实施例对本发明的相似病例推荐方法及系统作以下详细地说明。
实施例1:
本实施例提供了一种相似病例推荐方法,该方法具体如下:
S1、对病例库所有病例的症状和诊断信息做归一化处理,分别获得各病例的标准症状列表和标准诊断列表;
S2、获取知识图谱中症状与疾病相关的数据计算症状权重;
S3、依据各病例的标准症状列表与目标病例的标准症状列表的匹配情况,融合症状权重,计算症状相似程度;依据各病例的诊断集合与目标病例诊断列表的匹配情况,计算诊断相似程度;对症状相似程度与诊断相似程度取平均数,算得各病例与目标病例的相似程度;
S4、对求得的相似程度前5的病例,结合病例的年龄、科室信息进行重新排序,将相似程度前5名病例中与目标病例同科室、同年龄段的病例排名提前,可得最终的相似病例推荐结果。
本实施例中步骤S1中的对病例库所有病例的症状和诊断信息做归一化处理,具体如下:
S101、以病例号为索引,获取病例库所有病例的症状列表和诊断列表于缓存;
S102、根据知识图谱中的原词与归一词映射关系表,通过匹配原词名称(症状名称/诊断名称)与原词实体类型(症状/诊断)得到病例症状和诊断的归一词列表于缓存存储;知识图谱的原词与归一词映射表结构如下:
序号 | 字段名 | 字段含义 |
1 | original_word | 原词 |
2 | entity_type_id | 实体类型id |
3 | normalize_term_id | 归一词id |
4 | normalize_term_cn | 归一词中文名 |
5 | status | 知识状态 |
6 | update_time | 更新时间 |
本实施例步骤S2中的获取症状权重具体如下:
S201、获取知识图谱中症状与疾病相关的数据,抽取知识类型(起始实体类型-关系-终止实体类型)为疾病-相关症状-症状的全部相关知识,存储于症状与疾病知识表中;如下表所示:
S202、通过对知识图谱中症状-疾病的相关知识的提取,获取任一症状i所关联疾病的疾病数量Ni和知识库总的疾病数量N,从而计算症状权重。
本实施例步骤S202中的通过对知识图谱中症状-疾病的相关知识的提取,获取任一症状i所关联疾病的疾病数量Ni和知识库总的疾病数量N,从而计算症状权重具体如下:
S20201、对起始实体的归一词做去重计数,即得到知识库总的疾病数量N;
S20202、对症状与疾病知识表中的终止实体归一词做去重提取,获得知识库的症状列表;
S20203、根据知识库的症状列表,依次去重提取每个症状i对应的起始实体归一词集合,通过计算起始实体归一词的数量,即可得到每个症状i关联疾病的疾病数量Ni;
S20204、根据知识库的症状列表和每个症状i关联疾病的疾病数量Ni,得到症状-权重字典,公式如下:
其中,Wi作为病例相似程度的症状系数;N-Ni表示该症状无关的疾病数量;N表示知识库总的疾病数量。
本实施例步骤S3中的获取病例相似程度具体如下:
S301、用目标病例的症状和诊断列表匹配病例库其他病例的症状和诊断列表,分别得到目标病例与其他病例的症状和诊断的交集集合;
S302、根据目标病例与其他病例的症状的交集集合获取症状相似度;
S303、根据目标病例与其他病例的诊断的交集集合获取诊断相似度;
S304、将症状相似度和诊断相似度进行加权运算得到病例相似程度;
S305、结合病例的基本信息,以病例号、年龄、科室、症状相似程度、诊断相似程度及病例相似程度为表头的表格形式存储于缓存之中。
本实施例步骤S302中的症状相似度具体如下:
设被比较病例的症状列表为[i1,i2,i3…in];被比较病例与目标病例的症状交集集合为[i1,i2,i3…im];症状权重为Wi,则对应病例与目标病例的计算公式如下:
其中,S表示症状相似程度;Wi1+Wi2+Wi3+…+Wim表示症状交集集合的症状权重累加得到交集分数;n表示被比较病例的症状列表元素个数;
本实施例步骤S303中的诊断相似度具体如下:
设被比较病例的诊断列表为[z1,z2,z3…zk];被比较病例与目标病例的诊断交集集合为[z1,z2,z3…zj];则对应病例与目标病例的症状相似程度计算公式如下:
其中,S′表示症状相似程度;j表示诊断交集集合的个数;k表示被比较病例的诊断列表元素个数;
本实施例步骤S304中的病例相似程度是通过求取取症状相似程度S与诊断相似程度S’的平均值得到,公式如下:
其中,F表示病例相似程度。
根据前端需求,可分别根据症状相似程度、诊断相似程度、病例相似程度对生成的表格进行排序,分别得到不同排序条件下排名前5的记录,并对各前5的记录根据年龄和科室进行重新排序,将前5名的记录中与目标病例同科室、同年龄段的病例排名提前,可得最终的相似病例推荐结果。
实施例2:
本实施例提供了一种相似病例推荐系统,该系统包括数据层和数据处理层;数据层包括病例库管理模块,数据处理层包括预处理模块、症状权重获取模块、病例相似度获取模块和相似病例推荐模块;
其中,病例库管理模块用于维护病例的基础信息、电子病历的结构化大段文本以及症状和诊断信息;
预处理模块用于对症状及诊断信息做归一化处理,并根据知识图谱的原词与归一词映射表,对病例库所有病例包括目标病例的症状和诊断信息做原词到归一词的映射,得到病例的标准症状和标准诊断信息并存储为列表形式;其中,归一化处理是依据知识图谱的原词与归一词映射关系表获取症状和诊断所对的归一词;
症状权重获取模块用于基于知识图谱里知识类型为疾病-相关症状-症状的相关知识,获取症状权重,并形成症状-权重字典;
病例相似度获取模块用于基于传入的病例库所有病例的症状和诊断列表以及症状权重字典,以目标病例的症状和诊断为比对标准,计算其余所有病例的症状相似程度、诊断相似程度和病例相似程度,以字典形式存储;
相似病例推荐模块用于根据症状、诊断以及病例相似程度的计算结果,倒序排序得到相似程度由大到小的病例列表,并结合病例的年龄及科室的就诊信息,优先推荐相似程度高、同科室且同年龄段(0-6岁,6岁-18岁,18岁-60岁,60岁以上)的病例。
本实施例中的症状权重获取模块的工作过程具体如下:
(1)、获取知识图谱中症状与疾病相关的数据,抽取知识类型(起始实体类型-关系-终止实体类型)为疾病-相关症状-症状的全部相关知识;
(2)、对疾病-相关症状-症状的全部相关知识的起始实体归一词做去重计数,算得知识库总的疾病数量N;
(3)、对疾病-相关症状-症状的全部相关知识的终止实体归一词做去重提取,获得知识库的症状列表;
(4)、根据知识库的症状列表依次去重提取每个症状i对应的起始实体归一词集合,通过计算起始实体归一词的数量获得每个症状i关联疾病的疾病数量Ni;
(5)、对知识库的症状列表,依次根据所获取的每个症状关联的疾病数量Ni和所获取的总的疾病数量N,得到症状-权重字典,公式如下:
其中,Wi作为病例相似程度的症状系数;N-Ni表示该症状无关的疾病数量;N表示知识库总的疾病数量。
实施例3:
本实施例还提供了一种电子设备,包括:存储器和处理器;
其中,存储器存储计算机执行指令;
处理器执行所述存储器存储的计算机执行指令,使得处理器执行本发明任一实施例中的相似病例推荐方法。
处理器可以是中央处理单元(CPU),还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通过处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可用于储存计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现电子设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器还可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,只能存储卡(SMC),安全数字(SD)卡,闪存卡、至少一个磁盘存储期间、闪存器件、或其他易失性固态存储器件。
实施例4:
本发明实施例还提供了一种计算机可读存储介质,其中存储有多条指令,指令由处理器加载,使处理器执行本发明任一实施例中的相似病例推荐方法。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RYM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种相似病例推荐方法,其特征在于,该方法具体如下:
数据预处理:对病例入院记录电子病历的症状和诊断信息进行提取;并以病例为单位处理成标准症状和标准诊断列表,同时提取病例就诊时的就诊信息存储于字典,辅助后续获取病例相似程度;其中,就诊信息包括年龄及科室;
获取症状权重:基于知识图谱的症状和疾病相关的知识,提取症状在疾病诊断中所占的权重;
获取病例相似程度:根据目标病例的症状和诊断列表,并融合权重获取其他病例与目标病例的相似程度;
相似病例推荐:根据症状、诊断以及病例相似程度的计算结果,倒序排序得到相似程度由大到小的病例列表,并结合病例的年龄及科室的就诊信息,优先推荐相似程度高、同科室且同年龄段的病例。
2.根据权利要求1所述的相似病例推荐方法,其特征在于,数据预处理还包括对病例库所有病例的症状和诊断信息做归一化处理,具体如下:
以病例号为索引,获取病例库所有病例的症状列表和诊断列表于缓存;
根据知识图谱中的原词与归一词映射关系表,通过匹配原词名称与原词实体类型得到病例症状和诊断的归一词列表于缓存存储;其中,原词名称包括症状名称和/或诊断名称;原词实体类型包括症状和/或诊断。
3.根据权利要求1所述的相似病例推荐方法,其特征在于,获取症状权重具体如下:
获取知识图谱中症状与疾病相关的数据,抽取知识类型(起始实体类型-关系-终止实体类型)为疾病-相关症状-症状的全部相关知识,存储于症状与疾病知识表中;
通过对知识图谱中症状-疾病的相关知识的提取,获取任一症状i所关联疾病的疾病数量Ni和知识库总的疾病数量N,从而计算症状权重。
4.根据权利要求3中所述的相似病例推荐方法,其特征在于,通过对知识图谱中症状-疾病的相关知识的提取,获取任一症状i所关联疾病的疾病数量Ni和知识库总的疾病数量N,从而计算症状权重具体如下:
对起始实体的归一词做去重计数,即得到知识库总的疾病数量N;
对症状与疾病知识表中的终止实体归一词做去重提取,获得知识库的症状列表;
根据知识库的症状列表,依次去重提取每个症状i对应的起始实体归一词集合,通过计算起始实体归一词的数量,即可得到每个症状i关联疾病的疾病数量Ni;
根据知识库的症状列表和每个症状i关联疾病的疾病数量Ni,得到症状-权重字典,公式如下:
其中,Wi作为病例相似程度的症状系数;N-Ni表示该症状无关的疾病数量;N表示知识库总的疾病数量。
5.根据权利要求1-3中任一项所述的相似病例推荐方法,其特征在于,获取病例相似程度具体如下:
用目标病例的症状和诊断列表匹配病例库其他病例的症状和诊断列表,分别得到目标病例与其他病例的症状和诊断的交集集合;
根据目标病例与其他病例的症状的交集集合获取症状相似度;
根据目标病例与其他病例的诊断的交集集合获取诊断相似度;
将症状相似度和诊断相似度进行加权运算得到病例相似程度;
结合病例的基本信息,以病例号、年龄、科室、症状相似程度、诊断相似程度及病例相似程度为表头的表格形式存储于缓存之中。
6.根据权利要求5所述的相似病例推荐方法,其特征在于,症状相似度具体如下:
设被比较病例的症状列表为[i1,i2,i3…in];被比较病例与目标病例的症状交集集合为[i1,i2,i3…im];症状权重为Wi,则对应病例与目标病例的计算公式如下:
其中,S表示症状相似程度;Wi1+Wi2+Wi3+…+Wim表示症状交集集合的症状权重累加得到交集分数;n表示被比较病例的症状列表元素个数;
诊断相似度具体如下:
设被比较病例的诊断列表为[z1,z2,z3…zk];被比较病例与目标病例的诊断交集集合为[z1,z2,z3…zj];则对应病例与目标病例的症状相似程度计算公式如下:
其中,S′表示症状相似程度;j表示诊断交集集合的个数;k表示被比较病例的诊断列表元素个数;
病例相似程度是通过求取取症状相似程度S与诊断相似程度S’的平均值得到,公式如下:
其中,F表示病例相似程度。
7.一种相似病例推荐系统,其特征在于,该系统包括数据层和数据处理层;数据层包括病例库管理模块,数据处理层包括预处理模块、症状权重获取模块、病例相似度获取模块和相似病例推荐模块;
其中,病例库管理模块用于维护病例的基础信息、电子病历的结构化大段文本以及症状和诊断信息;
预处理模块用于对症状及诊断信息做归一化处理,并根据知识图谱的原词与归一词映射表,对病例库所有病例包括目标病例的症状和诊断信息做原词到归一词的映射,得到病例的标准症状和标准诊断信息并存储为列表形式;
症状权重获取模块用于基于知识图谱里知识类型为疾病-相关症状-症状的相关知识,获取症状权重,并形成症状-权重字典;
病例相似度获取模块用于基于传入的病例库所有病例的症状和诊断列表以及症状权重字典,以目标病例的症状和诊断为比对标准,计算其余所有病例的症状相似程度、诊断相似程度和病例相似程度,以字典形式存储;
相似病例推荐模块用于根据症状、诊断以及病例相似程度的计算结果,倒序排序得到相似程度由大到小的病例列表,并结合病例的年龄及科室的就诊信息,优先推荐相似程度高、同科室且同年龄段的病例。
8.根据权利要求7所述的相似病例推荐系统,其特征在于,症状权重获取模块的工作过程具体如下:
(1)、获取知识图谱中症状与疾病相关的数据,抽取知识类型(起始实体类型-关系-终止实体类型)为疾病-相关症状-症状的全部相关知识;
(2)、对疾病-相关症状-症状的全部相关知识的起始实体归一词做去重计数,算得知识库总的疾病数量N;
(3)、对疾病-相关症状-症状的全部相关知识的终止实体归一词做去重提取,获得知识库的症状列表;
(4)、根据知识库的症状列表依次去重提取每个症状i对应的起始实体归一词集合,通过计算起始实体归一词的数量获得每个症状i关联疾病的疾病数量Ni;
(5)、对知识库的症状列表,依次根据所获取的每个症状关联的疾病数量Ni和所获取的总的疾病数量N,得到症状-权重字典,公式如下:
其中,Wi作为病例相似程度的症状系数;N-Ni表示该症状无关的疾病数量;N表示知识库总的疾病数量。
9.一种电子设备,其特征在于,包括:存储器和至少一个处理器;
其中,所述存储器上存储有计算机程序;
所述至少一个处理器执行所述存储器存储的计算机程序,使得所述至少一个处理器执行如权利要求1至6任一项所述的相似病例推荐方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如权利要求1至6中任一项所述的相似病例推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211077445.0A CN115631823A (zh) | 2022-09-05 | 2022-09-05 | 相似病例推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211077445.0A CN115631823A (zh) | 2022-09-05 | 2022-09-05 | 相似病例推荐方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115631823A true CN115631823A (zh) | 2023-01-20 |
Family
ID=84902344
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211077445.0A Pending CN115631823A (zh) | 2022-09-05 | 2022-09-05 | 相似病例推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115631823A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116504354A (zh) * | 2023-06-28 | 2023-07-28 | 合肥工业大学 | 一种基于智慧医疗的智能化服务推荐方法及系统 |
CN118866221A (zh) * | 2024-09-24 | 2024-10-29 | 齐鲁工业大学(山东省科学院) | 一种基于规则库的无数据的患者数据生成方法 |
CN119314609A (zh) * | 2024-10-16 | 2025-01-14 | 北京嘉和海森健康科技有限公司 | 一种相似病历确定方法及装置 |
CN119719172A (zh) * | 2025-02-28 | 2025-03-28 | 沈阳西牧物联网技术有限公司 | 一种畜牧疾病信息快速检索方法及系统 |
-
2022
- 2022-09-05 CN CN202211077445.0A patent/CN115631823A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116504354A (zh) * | 2023-06-28 | 2023-07-28 | 合肥工业大学 | 一种基于智慧医疗的智能化服务推荐方法及系统 |
CN118866221A (zh) * | 2024-09-24 | 2024-10-29 | 齐鲁工业大学(山东省科学院) | 一种基于规则库的无数据的患者数据生成方法 |
CN119314609A (zh) * | 2024-10-16 | 2025-01-14 | 北京嘉和海森健康科技有限公司 | 一种相似病历确定方法及装置 |
CN119719172A (zh) * | 2025-02-28 | 2025-03-28 | 沈阳西牧物联网技术有限公司 | 一种畜牧疾病信息快速检索方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112037880B (zh) | 用药推荐方法、装置、设备及存储介质 | |
CN115631823A (zh) | 相似病例推荐方法及系统 | |
CN108648827B (zh) | 心脑血管疾病风险预测方法及装置 | |
CN110069779B (zh) | 医疗文本的症状实体识别方法及相关装置 | |
CN110111887A (zh) | 临床辅助决策方法及装置 | |
Fang et al. | Feature Selection Method Based on Class Discriminative Degree for Intelligent Medical Diagnosis. | |
CN112257422A (zh) | 命名实体归一化处理方法、装置、电子设备及存储介质 | |
CN114420279B (zh) | 一种医疗资源推荐方法、装置、设备及存储介质 | |
CN112885478A (zh) | 医疗文献的检索方法、装置、电子设备及存储介质 | |
US11604778B1 (en) | Taxonomic fingerprinting | |
CN110569349A (zh) | 基于大数据的患教文章推送方法、系统、设备及存储介质 | |
CN109213871A (zh) | 患者信息知识图谱构建方法、可读存储介质和终端 | |
CN117153378B (zh) | 一种导诊方法、装置、电子设备及存储介质 | |
CN119230090B (zh) | 一种基于知识图谱的病案的诊断和手术icd编码方法 | |
CN110752027B (zh) | 电子病历数据推送方法、装置、计算机设备和存储介质 | |
Tootooni et al. | CCMapper: An adaptive NLP-based free-text chief complaint mapping algorithm | |
CN112635072A (zh) | 基于相似度计算的icu相似病例检索方法、系统及存储介质 | |
CN111785383A (zh) | 数据处理方法及相关设备 | |
CN113571196A (zh) | 构建医疗训练样本的方法及装置、医疗文本的检索方法 | |
CN112530602A (zh) | 药品副作用分析方法、装置、电子设备及计算机存储介质 | |
CN112329461B (zh) | 相似病历确定方法、计算机设备及计算机存储介质 | |
CN115995281A (zh) | 一种基于数据治理的专病数据库的数据检索方法及装置 | |
CN116578704A (zh) | 文本情感分类方法、装置、设备及计算机可读介质 | |
CN119339971B (zh) | 一种临床路径自动规划方法 | |
Wang et al. | Research on named entity recognition of doctor-patient question answering community based on bilstm-crf model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |