下游KG与GNN模型的范例解说
1 複習:三層KG架構
首先复习已经详细介绍过的< 三层KG 架构>。然后基于这项创新架构,可以构建出一种<KG+GNN+LLM>整合式知识推理流程。其包含LLM 协助构建知识图谱(KG)、GNN推理潜在知识与反事实边、人类进行创新决策后回馈知识图,最终结合RAG与LLM完成可信、可控、可更新的主权AI 演化生态圈。此生态圈的最大价值是:
● 从无到有(用LLM建立KG):使用BERTopic预训练模型撷取候选实体,并由LLM 萃取语意关系并建构初步三元组(Triple)图谱,大幅提升初建KG 的在地性与语义密度。
● 从静态到推理(用GNN 和CF 探索):讯练GNN预测潜在关系,并透过GAT、R-GCN 等模型进行链接预测,探索反事实连结(CF Link),来激励人们的反事实思考(CF Thinking)。其将传统AI 推理升级为反事实推理与探索。
● 从推理到创新(人机协作产生决策):人类开始进行创新思考,并对潜在关系进行专家审查和反思,优化人们的决策。其中,引入了人机协作治理,人类专家主导反事实推理的解释与修正,避免AI 幻觉的偏差。
● 从创新到资产化(知识回馈更新KG,让KG 不断进化):依据人的决策回馈,来更新KG,形成动态进化式的知识生态。然后,透过RAG 框架,让LLM 响应与企业内知识结合,提升准确与可信度。
2 支援下游應用任務
在上一期里,已成功演示了一个案例,其中训练出一个能够把突变数据转换成嵌入向量的中游KG + GNN模型,而且嵌入已储存于mutation_embeddings_gin.csv档案里,可供给下游任务使用(如分类、群聚、可视化、或与影像特征融合等)。中游KG 扮演行业语境的桥梁,让LLM能入乡随俗,理解场域,成为可信任AI 的知识背景层(Context Layer)。
现在,基于已经训练好的节点嵌入(Node Embedding),来支撑下游应用<KG + GNN> 模型。这项下游任务结合了医学影像特征(Ultrasound/MRI)进行多模态推论,也将GNN输出的嵌入与CNN影像特征进行融合,提供AI辅助诊断(如预测、分类等)。如下图3 所示:
图3
这样可以顺利训练出一个能够把突变数据转换成嵌入向量的GNN模型,能产生节点的嵌入向量(Embedding),来提供给后续的下游任务使用(如分类、群聚、或与影像特征融合等)。例如,下游任务可以结合医学影像特征(Ultrasound/MRI)进行多模态推论,也将GNN 输出的嵌入与CNN影像特征进行融合,提供AI 辅助诊断(如预测、分类)等各种应用。
3 实践范例
例如,乳腺癌症的诊断与治疗策略高度仰赖基因、突变、生物标志物与病理影像等异质信息。而上述的三阶段知识图谱架构(KG)为基础的乳腺癌主权AI 解决方案。透过串接国际生物医学数据、结合院内检测与病例数据,最终建构可用于推理、推荐与决策辅助的AI系统。例如,结合病理影像模型与KG 多模态推理,建构问答式临床决策支持接口,进而- 建立跨院共享型乳癌主权知识平台等。
此范例使用Python代码来实践模型训练,并搭配xlwings和openvino套件,来提供可操作的Excel画面和部署(Deployment)环境。首先,开启ee01.py,如下:
Step-1:建立下游KG
接着,执行它(即ii01.py),并且在Excel 画面按下< 建立下游KG> 按钮,就建立了一个下游KG(图-2):
这个下游KG 含有4 种节点:疾病(cancer)、基因(gene)、突变(mutation)和超声波检测(ultra),其整合ultra节点特征参与讯息传递与分类。这种以疾病-基因-药物为核心的多重链接结构,非常适合用KG+GNN建模。此类系统若整合影像与知识,可有效推促进医疗AI的发展。例如本案例融合了Ultra node所提供的视觉特征,进一步提升癌症分类的准确性与上下文理解能力。
同时,这个下游KG可赋能乳癌精准医疗,从串联基因与治疗决策逻辑,透过attention与反事实推理回溯依据,提升AI推论可解释性。并且符合主权AI要求:数据本地处理、自研模型训练、决策过程可控。
Step-2:训练GNN模型
接着,按下< 训练下游模型>,就展开训练GNN流程,如下:
训练完成了,就导出ONNX模型,并储存于ultra_cancer_classifier.onnx档案里,将会在OpenVINO 平台上进行模型部署。
除了医疗领域之外,在其它制造业、医疗、法务、教育等「需本地知识又要求精准推理」的场景中,上述方法都具高度适用性。而且,不需要训练大型模型,只需整合KG+GNN+LLM,就能实践商业应用目标。
Step-3:部署模型&推論
接着,按下<OpenVINO 部署&推论>,就出现:
于是,完成了「用下游KG来预测癌症类型」的初步实作。其将影像推论(ultra 特征)作为语意节点纳入异质知识图中,透过GNN 传递形成融合的癌症语义表示。最终分类器已导出为ONNX,可于OpenVINO 原型环境下进行轻量推论。
这使用突变+ 基因节点特征,透过异质GNN,预测癌症节点的类别(乳癌vs 非乳癌)。这下游任务中的GNN模型训练与推理(例如癌症分类、mutation 预测)。
本案例的系统架构,也可预测多种癌症(如Bladder Cancer、Bone Cancer、Breast Neoplasms 等),并透过混淆矩阵与ROC 曲线验证模型判断能力,证实中游语义嵌入能有效支持下游分类任务。
4 结语
由于许多AI 部署流程, 常常缺乏语境在地化(Contextualization)特性,导致模型布署后难以完全贴合本地知识、生产流程与客户需求。这种以中游KG 作为语境支撑层,让下游AI 系統真正入乡随俗、自主成长。
例如,藉由知识图谱结构化推理与持续自我更新,AI甚至能预测、引导、优化用户的决策,达成超越人类直觉的智慧支持。也让每一个装置,都能懂你,而且比你更懂你!
(本文来源于《EEPW》202507)
关键词: 202507

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码