当前位置: 代码迷 >> 综合 >> 论文笔记:Predicting miRNA–disease association based on inductive matrix completion
  详细解决方案

论文笔记:Predicting miRNA–disease association based on inductive matrix completion

热度:83   发布时间:2023-12-06 18:38:30.0

代码:https://github.com/IMCMDAsourcecode/IMCMDA

摘要

动机:研究表明,miRNAs在与人类疾病相关的各种生物过程中起着关键作用。考虑到生物实验的成本和复杂性,预测微小核糖核酸和疾病之间潜在联系的计算方法将是一个有效的补充。
结果:本文提出了一种新的用于微小核糖核酸-疾病关联预测的诱导矩阵完成模型。基于miRNA功能相似性、疾病语义相似性和高斯交互分布核相似性计算整合miRNA相似性和疾病相似性。主要思想是基于已知的关联以及整合的miRNA相似性和疾病相似性来完成缺失MiRNA-疾病关联。IMCMDA基于留一交叉验证和改进的先前模型实现了0.8034的AUC。此外,在三种类型的案例研究中,对五种常见的人类疾病采用了国际疾病管理和监测数据库。在第一种类型中,结肠肿瘤、肾脏肿瘤、淋巴瘤的前50个预测微小核糖核酸中分别有42、44、45个被实验报告证实。在没有任何已知微小核糖核酸的新疾病的第二类病例研究中,我们通过隐藏微小核糖核酸和乳腺肿瘤之间的关联信息,选择乳腺肿瘤作为测试实例。因此,前50个预测的乳腺肿瘤相关微小核糖核酸中有50个得到了验证。在第三种类型的案例研究中,在HMDD V1.0上测试了IMCMDA,以评估IMCMDA的鲁棒性,前50个预测的食管肿瘤相关微小核糖核酸中的49个得到了验证。

模型

  1. 人类MiRNA-disease关联数据
    数据来源于HMDD v2.0(http://www.cuilab.cn/hmdd)数据库,现在已经升级到v3.2。构建关联矩阵,若存在已知MiRNA-Disease关联则为1,否则为0。
    在这里插入图片描述
    2. MiRNA功能相似度
    MiRNA功能相似性的计算基于一个基本假设,即功能相似的MiRNA往往与相似的疾病有关。数据来源:http://www.cuilab.cn/files/images/cuilab/misim.zip
    3. 疾病语义相似度
    本篇论文提出了两种疾病语义相似度的衡量方法,下面将具体介绍:
    (1) 疾病语义相似度模型1
    基于从Mesh数据库下载的网状描述符,构造了一个有向无环图(DAG)来描述疾病。疾病D的DAG不仅包括D和D本身的祖先节点,还包括从父节点到子节点的直接边。
    此图中描述了两个疾病的DAG,蓝框为原位乳腺癌的DAG表示,红框为手皮炎的DAG表示。(只是举了一个小栗子便于理解啦~)
    此图中描述了两个疾病的DAG,蓝框为原位乳腺癌的DAG表示,红框为手皮炎的DAG表示。(只是举了一个小栗子便于理解啦~
    下面是疾病相似度的计算方法:
    在这里插入图片描述
    (2) 疾病语义相似度模型2
    语义相似度模型2与1的区别主要体现在计算每个节点的语义贡献度上,假设同一层中有两种疾病,如果一种疾病出现的疾病DAGs少于另一种疾病,显然我们可以得出结论,第一种疾病对疾病D的语义价值的贡献大于第二种疾病。综上所述,同一层DAG(D)中不同的疾病术语可能对疾病D的语义价值有不同的贡献。
    个人对这句话的理解,还是看第一幅图,乳房结缔组织疾病即出现在了原生乳房疾病的DAG中,又出现在手皮炎的DAG中,那么先对于同层的肿瘤,乳房结缔组织疾病这个节点的语义贡献更大,基于这样的思想,语义贡献度计算如下:
    在这里插入图片描述
    (3) 两种疾病语义相似度的融合——取平均值
    4. 疾病和MiRNA的高斯相互作用轮廓核相似性
    此方法还需用到邻接矩阵来计算,例如下图的邻接矩阵:
    在这里插入图片描述
    在此邻接矩阵中共包含了四种疾病和5中MiRNA,已知的连接关系已经在邻接矩阵中给出。例如计算d1和d2的相似度,载体IP(d(i))通过观察疾病d(i)和每个miRNA之间是否存在已知的联系来表示疾病d(i)的相互作用概况,此时的IP(d1)可以表示为[1 0 1 1 0];IP(d2)可以表示为[1 1 1 1 1],利用下列公式计算两个疾病的高斯相似度:
    在这里插入图片描述
    在这里插入图片描述
    计算结果为0.726。
    5. 疾病和MiRNA的综合相似性
    理由是并不是所有的疾病之间都有语义相似度的,也不是所有的MiRNA之间都存在功能相似度,因此本篇论文利用高斯相似度来补全疾病语义相似度和MiRNA功能相似度。
    在这里插入图片描述
    在这里插入图片描述
    6. IMCMDA
    在这篇文章中,我们提出了一种新的基于矩阵补全的模型,称为IMCMDA,用于MiRNA-疾病相关性预测。IMCMDA的这一模型是基于已知的MiRNA-疾病关联、疾病语义相似性、微小核糖核酸功能相似性、微小核糖核酸和疾病的高斯相互作用谱核相似性来实现的。IMCMDA的具体实现过程下图所示。
    在这里插入图片描述
    模型理解
    在这里插入图片描述
  相关解决方案