摘要:目的 设计并构建一种融合中医面色诊断信息的辨证知识图谱,探讨知识间的隐性关系。方法 文献数据来源于古籍经典、教材,以及中国知识资源总库(CNKI)、中文科技期刊数据库(VIP)、中国学术期刊数据库(万方数据)建库至2022年12月31日收录的望诊相关标准类文献。临床数据来源于2022年9月上海市嘉定工业区社区卫生服务中心进行中医健康体检的老年人30名,采用TFDA-1型数字舌、面诊仪进行面部图像采集。通过知识抽取、知识融合、质量评估等图谱构建步骤,在中医专家辅助判读基础上,采用Access2019集成定性的文字数据和定量的客观化图像数字信息,在Neo4j图数据库中设计完成融合中医面色诊的辨证知识图谱。同时,还设计一种将面色诊断知识从定性到定量的方法。结果 知识图谱包含8种实体术语类型和12种实体术语标签下的194个节点、13种语义关系下的361条关系,在Neo4j图数据库中提供可视化的中医面色诊辨证知识图谱,可使用Cypher语言进行查询和反馈。结论 基于中医面色诊理论构建的知识图谱,可视化地展示了面色诊与辨证诊断之间的复杂关联,形成图像特征定性数据→语义关系→辨证诊断形式的知识表示模式。
加入收藏
知识图谱是Google公司在2012年率先提出的一项基于大数据和人工智能算法的信息存储和检索系统[1],这一概念革新了传统的数据搜索模式,以“图搜索”[2]的方式更为直观和快速地呈现数据间的复杂关系。知识图谱发展至今,已受到多学科交叉领域的广泛关注和联合应用。在中医学领域,相关研究起步较晚[3],特别在中医诊断学亚学科方向视域中,至今缺乏具有整体性和全局性的中医综合望诊知识图谱项目,仅有少数以舌诊为核心或边缘节点的中医诊断知识图谱,并以探索性研究为主。
中医整体观认为人体是一个有机整体[4],如朱丹溪提出“有诸内者,必形诸外”,通过观察外在的表征,可以推测机体内的变化,判断整体的生理或病理状态。在中医诊断中,望诊居四诊之首,在辨证过程中有无可替代的作用,而面部、舌部望诊即面色诊、舌诊,因其为经络汇聚之处、五脏六腑之窗口,而且观察简便,故在望诊中占据重要地位。已有学者在局部望诊方面进行了探索性研究,如范宝超[5]从舌象出发,利用知识图谱技术发挥舌诊在乳腺癌中医诊断中的重要作用,形成了从舌象属性出发的中医辨证论治路径推理;张莹莹[6]设计了一款基于中医药知识图谱的舌像诊疗系统,根据用户输入的症状和舌象照片,能够生成基于中医舌诊的疾病辨证结果。然而,与面色诊相关的知识图谱项目研究鲜见。
本研究以中医面色诊理论为指导,结合研究团队前期中医面色诊客观化研究基础,旨在探讨构建融合中医面色诊的辨证知识图谱的方法与实践,利用非结构化文本数据和临床采集的面部数字化信息,通过知识抽取、知识融合、质量评估等构建步骤,在Neo4j图数据库中设计完成融合中医面色诊的辨证知识图谱。
1、资料与方法
1.1文献数据来源
主要包括古籍经典、教材及公开发表的现代文献中有关中医诊断的基本理论知识。其中古籍经典与教材分别以《黄帝内经素问语译》《伤寒论语译》《中医诊断学》为蓝本;现代文献资料来源于中国知识资源总库(CNKI)、中文科技期刊数据库(VIP)、中国学术期刊数据库(万方数据),检索式为(主题=“中医”OR主题=“中医学”)AND(主题=“诊断”OR主题=“辨证”OR主题=“基础”OR主题=“面诊”OR主题=“面色”OR主题=“望诊”OR主题=“四诊”)AND(主题=“指南”OR主题=“规范”OR主题=“标准”),检索时间范围均为建库至2022年12月31日,在“中医诊断学”和“中医基础理论”文献分类下,筛选得到期刊论文共154篇,经人工排除相关性不高和重复文献后,最终纳入19篇。
1.2临床数据来源
2022年9月在上海市嘉定工业区社区卫生服务中心进行中医健康体检的老年人30名,其中男性12名,女性18名,年龄60~70岁。
纳入标准:(1)体检无明显指标异常且无颜面部改变者;(2)近3个月内无急性病或慢性病急性发作者;(3)自愿参加本研究,并签署知情同意书。排除标准:(1)工作、职业可能引起颜面部改变者;(2)颜面部有遗传性偏色者;(3)面部化妆者。
使用上海中医药大学中医诊断信息智能处理实验室自主研发的TFDA-1型数字舌、面诊仪进行面部图像采集,设备光源为D50。采集时间为7:00-9:00空腹时。采集前向受试者讲解标准图像拍摄姿势,嘱受试者取端坐位,佩戴眼镜者需取下眼镜,刘海遮挡面部者需整理刘海以避免遮挡,受试者视线应与仪器摄像头平齐,将下颌置于下颌托处,闭合双眼,然后由研究者打开光源,在取景框内观察到稳定的面部图像画面后,点击录屏,完成面部图像采集[7]。
1.3数据处理
对纳入的文献资料进行归纳整理和数据预处理,具体包括:(1)对不同来源的中医望诊面色描述进行合并,如“面色淡白”“面色㿠白”均以“面白”进行面部颜色的规范表述;(2)对相同的证型名称或具有相同含义的不同证型名称进行合并,如“气虚证”“气虚型”“气虚”均以“气虚证”进行规范表述;(3)对不同种类的辨证方法,按八纲辨证、气血阴阳辨证和脏腑辨证3类进行归纳与合并,如“阴阳辨证”归属“八纲辨证”,“血病辨证”归属“气血津液辨证”,“心与小肠病辨证”归属“脏腑辨证”等。
对纳入临床资料,将面部图像按中医临床诊断需求进行分区,分为庭(Ting)、阙(Que)、明堂(Mingtang)、颏(Ke)、左颧(Left Quan)、右颧(Right Quan)、左颊(Left Jia)、右颊(Right Jia),共8个部位,分区部位对应位置见图1。从望面色的角度,观察面部颜色可体现人体血色是否正常,观察面部光泽可反映精气是否充沛。基于五色诊理论,将面部病色分为青、赤、黄、白、黑5种,分别与不同脏腑和不同性质疾病相关联,由2名中医诊断学专业的副高级以上职称中医专家对面部图像进行辅助判读,如2名专家意见分歧较大不能达成一致,交由专家委员会裁定,专家委员会由上海中医药大学中医诊断信息智能处理实验室组成。中医专家对面部颜色和光泽进行标签划分,并对文献资料进行补充合并,使面色部分的描述更为精细和准确。
图1 中医面色诊“8”分区及对应位置示意
1.4研究工具与设计
采用Excel2019分别录入原始数据并进行数据清洗,包括行列重命名、删除重复值和异常值、数据(名词)标准化等,然后将数据导入Access2019关系数据库管理系统,在软件集成定性的文字数据和定量的客观化图像数字信息,最后导出CSV文件,用于Neo4j图数据库的可视化中医面色诊知识图谱构建与处理。
采用自上而下的方法构建中医望诊知识图谱,寻找望诊面部不同分区图像与中医八纲属性、脏腑定位和气血状态的知识语义关联,形成可视化证候指向关系,同时根据中医望诊面部图像人工标签的分区数据,综合面部颜色和光泽特征,归纳梳理面色诊特征知识,然后基于中医八纲辨证、脏腑辨证、气血辨证的理论基础,形成多部位、多层次、多维度的辨证特征数据库,完善融合中医面色诊的计算机辨证诊断方法,提升知识图谱科学内涵。
1.5逻辑架构建立
知识图谱的逻辑架构主要包括数据层和模式层:数据层作为底层逻辑,以经典“三元组”结构(“实体-关系-实体”或“实体-属性-属性值”)存储知识信息;模式层在数据层之上,将梳理提炼后的知识信息进行本体化,规范实体、关系、属性等对象之间的相互联系[8]。在辨证知识图谱的构建过程中,将中医辨证知识作为模式层的核心,融合中医面色诊相关知识,对提纲挈领的中医术语与概念进行类的梳理归纳,将不同的辨证方法(八纲辨证、气血阴阳辨证和脏腑辨证)和面色诊相关知识分别设计为并列的第一层级(见图2)。围绕以上层级设计次第展开,按概念、关系、属性、属性值等依次填充剩余层级,实现从辨证到表观、从表观回到辨证的双向推理路径(见图3)。
图2 中医面色诊术语与概念大类梳理示意
在具体构建上,参考中国中医科学院中医药信息研究所发布的临床术语系统分类结构[9]和中医语言系统的语义网络框架[10],结合中医辨证诊断的临床特色,建立术语分类和术语间语义关系,形成实体术语类型共8种,包括诊断方法(diagnosis)、证(syndrome)、病因(etiology)、病机(mechanism)、病位(location)、部位(region)、颜色(colour)、光泽(gloss);不同实体间语义关系共13种,包括“包含(contains)”“由……组成(consists_of)”“是……的部分(part_of)”“有(has)”“证型为(syndrome_is)”“定位于(positioned_on)”“表现形式(manifestation_of)”“原因(causes)”“发展成(develops)”“反映(reflects)”“发生于……情况下(occurs_in)”“与……相关(connected_to)”“……的现象(phenomenon_of)”。术语分类和术语间语义关系示意见图4。
1.6技术架构建立
在逻辑架构的基础上,应用知识抽取、知识融合、质量评估等技术方法,建立辨证知识图谱的技术架构(见图5)。
图3 中医面色诊知识图谱逻辑架构
图4 中医面色诊术语分类和术语间语义关系示意
图5 中医面色诊知识图谱技术架构
知识抽取是指从海量的原始信息中提取出知识要素,并按不同实体类型将其存入逻辑架构的数据层和模式层的过程,主要包括实体抽取如“面”“颧”“心肾不交”“气血亏虚”等,关系抽取如“面白‘反映’气虚证”“脏腑辨证‘包含’心与小肠病辨证”等。知识融合的目的在于剔除重复、冗余和矛盾甚至错误的知识信息,并把不同来源和构成的数据信息进行整合,通过实体消歧和共指消解,判断知识库中的同名实体间是否存在不同含义表达及异名实体间是否存在相同含义的表达,如“面”抓取“用于描述人体部位”的含义而非“几何学上指一条线移动所构成的图形”含义,而“前额”“额部”均指“庭部(Ting)”。质量评估是知识图谱可靠、高效运行的关键环节和重要保障,其意义在于定性与定量地评估知识的信效度,在辨证知识图谱中可能出现的主要问题有结构性错位如实体间关系指向矛盾、从树状结构变成局部环状结构,逻辑问题如实体与实体间的关系逻辑不符合客观事实。
2、结果
本研究选用Neo4j图数据库进行辨证知识图谱数据的最终存储与可视化展示。Neo4j是由Java实现的一款开源No Sql数据库[11],基于数学中的图论概念而建,将数据及数据之间的关系存在“节点”和“边”中,使用Cypher语句可快速查询目标数据信息及信息间错综复杂的关系。根据辨证知识图谱的构架设计与语料收集,形成包含8种实体术语类型和12种实体术语标签下的194个节点及13种语义关系下的361条关系,最终设计并构建融合中医面色诊的辨证知识图谱,可视化展示中医面色诊与中医辨证诊断之间的丰富联系与深刻内涵,突显面色诊在中医辨证中的重要性,体现司外揣内的辨证思想。示例见图6。
图6 融合中医面色诊的辨证知识图谱可视化展示(部分)
使用Neo4j图数据库的查询语言Cypher对知识图谱进行知识信息检索与分析,示例如下。
根据望诊观察到的“面白”表现,结合其他临床信息,推测患者的生理病理情况和对应的中医诊断证型,可通过查询语句:match p=(n:colour{name:'面白'})-[r:relation]-() return p,见图7,提示可能的病因、病位和诊断证型等信息。
明确“寒证”所对应的面色诊和诊断信息,可通过查询语句:match p=(n:syndrome{name:'寒证'})-[r:relation]-() return p得以实现,见图8。
图7 中医面色诊“面白”知识图谱可视化展示
图8 中医面色诊“寒证”知识图谱可视化展示
3、讨论
本研究基于中医面色诊理论指导思想,设计并构建融合中医面色诊的辨证知识图谱,形成图像特征定性数据→语义关系→辨证诊断形式的知识表示模式。对本研究纳入的文献进行知识融合,将不同来源的中医望诊面色描述进行合并,对相同证型名称或具有相同含义的不同证型名称进行合并,按八纲辨证、气血阴阳辨证和脏腑辨证3个大类将不同辨证方法进行归纳与合并,能够较全面囊括面色诊知识术语;纳入的老年人面部图像信息在中医面色诊“8”分区划分下有较好的一致性,受面部生理皱纹、色斑影响较小。结果表明,以古籍经典、教材及公开发表的现代文献中有关中医诊断的基本理论知识为理论数据来源,结合临床面部图像信息,通过知识图谱的构建流程与规范,构建知识图谱并通过Cypher语言查询输出的方法基本可行,在下一阶段研究中,课题组拟按面色诊知识定性向定量转化方法设计纳入面色诊图像的客观化面色指标,并考虑面部纹理等特征的提取、识别与分类细化,同时尝试在不同实体关系之间添加双向关系,形成双向推理模式,进一步丰富和完善融合中医面色诊的辨证知识图谱。
面色诊知识定性向定量的转化方法设计如下:基于面色诊图像信息,用Python3.8.12调用相应的函数模块,实现根据面部图像的分区与特征提取,按中医面色诊“8”分区,提取拍摄的面部图像素点的面部纹理特征参数包括对比度(Contrast)、角度方向二阶矩(ASM)、熵值(Entrop)、平均值(Mean),同时提取面部的颜色和光泽特征[12],RGB(红、绿、蓝三通道)色度空间值分别进行计算,在运用色度空间时考虑到颜色表现直观性和分类可行性,进一步将RGB色度空间模型进行YCr Cb(明亮度、色度)、HSI(色度、亮度、饱和度)和Lab(明度、色彩双通道)色度空间的转换。将Contrast、ASM、Entrop、Mean分别赋予纹理属性标签,将RGB、YCr Cb、HSI、Lab分别赋予颜色属性标签,并对每个属性标签下的值赋予属性值标签,以此类推,将面部纹理和色泽从肉眼主观判读,与客观化数据一一对应,从而进一步实现定性到定量的转化。见表1。
表1 面部不同纹理、色度空间指标与参数意义
面色诊是中医局部望诊的核心知识与重要代表,利用知识图谱基于图的数据结构特点和语义网络特性,将包括古籍经典和现代研究在内的大量中医诊断知识,以适应新时代医疗信息化的方式进行传播、分享、处理和展示,并尽可能减少信息损失、保留知识原意,对中医诊断现代化、客观化、智能化有重要意义。本研究对融合面色诊望诊信息的中医辨证知识图谱的研究工作做出了积极的探索和尝试,尚不够完善和深入,仍需进一步研究,包括对大量由古籍经典产生的名称术语的规范化表示、对经典理论内在逻辑的解构梳理、对四诊不同维度的知识信息集成融合等,力求形成具有公信力和开放共享的本体,在此基础上构建整体性和全局性的中医综合望诊知识图谱项目。
参考文献:
[2]马帅,李佳,刘旭东,等.图查询:社会计算时代的新型搜索[J].中国计算机学会通讯,2012,8(11):26-31.
[3]孔鸣,何前锋,李兰娟.人工智能辅助诊疗发展现状与战略研究[J].中国工程科学,2018,20(2):86-91.
[4]杨帅,徐莹,王立娟,等.基于舌、面诊的中医健康状态辨识理论与方法研究概述[J].中国中医药科技,2021,28(5):861-864.
[5]范宝超.基于知识图谱及神经网络的乳腺癌中医舌诊中药推荐技术研究[D].广州:广州中医药大学,2021.
[6]张莹莹.基于知识图谱的舌像诊疗系统研究与构建[D].成都:电子科技大学,2019.
[7]李加才,屠立平,姚兴华,等.基于中医数字化面诊技术的健康状态人群面色特征研究[J].中华中医药杂志,2022,37(1):342-347.
[8]刘峤,李杨,段宏,等.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600.
基金资助:国家重点研发计划-中医药现代化研究重点专项(2017YFC1703301);国家自然科学基金(82104738、81873235);中国博士后科学基金面上项目(2023M732337);上海市科委地方院校能力建设项目(21010504400);上海市“超级博士后”激励计划(2022509);
文章来源:张晓燕,王瑞,楼锦娣,等.融合中医面色诊的辨证知识图谱设计与构建方法研究[J].中国中医药信息杂志,2024,31(12):42-48.
分享:
GERD全球总体患病率逐年升高,患病病例从1990年的4.4157亿增加至2019年的7.8395亿,增长77.53%[2]。Meta分析表明[3],胃食管反流病全球患病率约为14.8%,美国约为19.6%,亚洲地区约为10%,东南亚约为7.4%。在西方国家发病率随年龄增长而增高,在发病人群分布上,男女无明显差异[4]。
2025-09-05肾病综合征(nephroticsyndrome,NS)是一种反复发作、有多种肾脏病理损害、病程长、以“三高一低”为基本特征的临床综合征,表现为大量蛋白尿(>3.5g/d)、低白蛋白血症(血清白蛋白<30g/L)、水肿和高脂血症[1]633-634。若病情持续进展,可导致血栓栓塞重要脏器、心脑血管意外、肾功能下降,甚则迁延为终末期肾病,影响生活质量,甚至威胁生命。
2025-08-19痤疮是一种好发于青春期、主要累及颜面部位毛囊皮脂腺单位的慢性炎症性皮肤病,其发病主要与皮脂大量分泌、痤疮丙酸杆菌增殖、毛囊皮脂腺导管的角化异常、炎症等因素相关[1]。该病易遗留炎症后红斑,影响面部美观[2]。目前现代医学多采用以抗菌药物为主的对因治疗方式,停药后复发率较高[1]。
2025-08-19胃食管反流病(gastroesophagealrefluxdisease,GERD)是指胃内容物反流入食管引起的反流相关症状和/或并发症的一种疾病,包括食管综合征和食管外综合征[1]。GERD发病率在我国呈逐年升高的趋势,现代医学治疗以质子泵抑制剂为一线药物,但仍有患者使用后症状缓解不明显,且存在复发率高、不良反应多等问题[2-3]。
2025-08-18针对慢性咳嗽,现代医学主要采用消炎、解痉、止咳等治疗方法,虽能缓解临床症状,但病情容易反复,整体疗效不够理想。本病可归属于中医学“久咳”“久嗽”“顽咳”等范畴,治疗常取祛风逐邪、调畅脏腑气机、祛痰化瘀等方法,止嗽散就是常用于治疗慢性咳嗽风邪犯肺证的经典方剂,小青龙汤、苓甘五味姜辛汤多用于治疗寒饮为重的慢性咳嗽[2-3]。
2025-08-07慢性心力衰竭(以下简称心衰)作为多种心血管疾病的终末转归,以呼吸困难、疲乏和液体潴留(肺淤血、体循环淤血及外周水肿等)为主要临床表现[1]。值得注意的是,心衰患者病程多迁延反复,特别是顽固性终末期心衰,常伴随显著的精神心理共病,研究显示约30%的西方心衰患者合并抑郁症[2],而我国心衰患者抑郁/焦虑发病率更高达40.1%[3]。
2025-08-07据统计,约10%的体外受精-胚胎移植(Invitrofertilization-embryotransfer,IVF-ET)患者深陷RIF困境,不仅身心备受煎熬,也承受巨大的经济压力。在胚胎植入过程中,免疫调节机制异常复杂,而免疫异常是导致RIF的重要因素之一。尽管医学界对此进行深入研究,但迄今尚未形成公认、统一的治疗方案[3-4],故探索更有效、精准的RIF治疗方案是当前生殖医学面临的一大挑战。
2025-08-07现代医学对VVS的研究较多,认为其发病主要与贝-亚反射、压力感受器敏感性降低、心脏自主神经调节异常、外周循环阻力下降,以及与基因和遗传等因素有关[3]。近年来的临床研究表明,西医对VVS缺乏有效的药物治疗方法,目前VVS的治疗主要采用非药物疗法,包括健康教育、生活方式调整和倾斜训练等[1]。
2025-07-31“易肇医之端,医蕴易之秘”,正所谓“医易同源”,唐代道医孙思邈真人曾言“不知易,不足以言太医”[1-2],管氏针灸治疗体系蕴含着深厚的易学理论,其布穴、定位、行针都体现了“易理”。管氏针灸学术流派治疗脊柱病重在恢复局部气血阴阳之平衡。
2025-07-21臀中肌综合征的病情缠绵难愈,且容易反复,病情加重者可出现臀中肌挛缩,进一步影响患者的生活质量。足少阳经筋循行分布于髋部外后侧,并经过臀中肌的解剖区域,臀中肌综合征的发生、发展与足少阳经筋的病变密切相关,属于“经筋病”范畴[2]。
2025-07-16人气:19315
人气:17798
人气:16682
人气:15828
人气:13877
我要评论
期刊名称:中国中医药科技
期刊人气:3816
主管单位:国家中医药管理局
主办单位:国家中医药学会
出版地方:黑龙江
专业分类:医学
国际刊号:1005-7072
国内刊号:23-1353/R
邮发代号:14-240
创刊时间:1994年
发行周期:双月刊
期刊开本:大16开
见刊时间:7-9个月
影响因子:1.881
影响因子:1.074
影响因子:1.483
影响因子:0.495
影响因子:0.498
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!