针对“药品说明书”,运用NLP技术将无结构的说明书文本中,提取出诸如“药品名称”、“疾病名称”、“器官名称”、“病毒名称”等15种命名实体,和83种关系,运用KG技术,构建“药理药效知识图谱”、“诊疗标准化事理图谱”、“药品本题库”、“诊疗推理引擎”等图谱生态体系。可用于智慧新药研发、智慧诊疗等领域的知识检索、智能问答、辅助决策等。
针对“开源文献”,运用NLP、OCR和知识图谱技术于无结构的开源科技文献中,构建蛋白互作用网络,可用以对蛋白组学分析、通路预测、靶向靶点分析预测等。
目前,生物医药领域有大量无结构的文本文献,其信息难以结构化、语义化、智能化。在药品研发、诊断用药等过程中,需要查阅大量知识,了解药物、患处、症状、器官等相互作用关系,以及它们构成的复杂网络性质等。
而现有工具例如Cystoschope等,只能用于结构化的数据库信息提取后,再生成网络。但是生成网络后,在可视化、语义化、复杂网络计算等功能上均不够理想。遑论无结构的文本文献,更是无从下手。
知识图谱作为大型语义网络,它的信息表达能力更加强大,而且具备强化学习、社区分析、中心节点计算、节点画像、通路查询计算,网络影响查询计算等强大功能,能够对生物网络靶标的相关分析和计算、药品组合药效药性研究和查询提供强力支撑。