算法:IMPACT通过微生物特征分析可解释的微生物表型
算法:IMPACT通过微生物特征分析可解释的微生物表型
人类肠道微生物由数万亿细菌组成,对健康和疾病有重大影响。通过现代技术的进步,高通量分析提供了增强我们对微生物组与复杂疾病结果之间联系的理解的潜力。然而,目前的微生物组模型缺乏微生物特征的可解释性,这仍然是一个开放的挑战,限制了对肠道微生物组在疾病中的作用的更深层次的理解。为了解决这个问题,我们提出了一个框架,该框架结合了特征工程步骤,使用功能性微生物注释数据库将表格丰度数据转换为图像格式,并结合了用于表型分类的剩余空间注意转换块架构。
与类似的方法相比,我们的模型IMPACT在多类分类中提供了更好的预测精度性能。更重要的是,我们的方法通过图像分类显著性方法提供了可解释的特征重要性。这使得提取与疾病结果相关的分类标记(特征)及其相关的功能性微生物特征和代谢物成为可能。
Abstract Motivation
The human gut microbiome, cisting of trilli of bacteria, significantly impacts health and disease. High-throughput profiling through the advancement of modern technology provides the potential to enhance our understanding of the link between the microbiome and complex disease outcomes. However, there remains an open challenge where current microbiome models lack interpretability of microbial features, limiting a deeper understanding of the role of the gut microbiome in disease. To address this, we present a framework that combines a feature engineering step to transform tabular abundance data to image format using functional microbial annotation databases, with a residual spatial attention transformer block architecture for phenotype classification.
Results Our model, IMPACT, delivers improved predictive accuracy performance across multiclass classification compared to similar methods. More importantly, our approach provides interpretable feature importance through image classification saliency methods. This enables the extraction of taxa markers (features) associated with a disease outcome and also their associated functional microbial traits and metabolites.
IMPACT的目标是促进微生物组数据的可解释深度学习模型。IMPACT的关键创新是将传统的表格微生物组数据转换为图像,允许使用先进的计算机视觉技术进行疾病分类并深入了解重要的分类。该框架背后的三个关键概念是:(i)分类相似性,(ii)低维表示和(iii)图像变换。
第一步是评估分类的相似性。IMPACT通过使用从微生物注释数据库Agora2 (Heinken et al. 202)和微生物目录(Shaaban et al. 2018)中提取的物种水平的人类共代谢功能信息来考虑类相似性。然后,构建的相似性有助于将相对丰度矩阵降低为低维嵌入,并将其转换为图像格式,作为深度学习模型的输入。我们将这种代谢方法与其他常见的相似性进行了比较,如Pearson相关性、基于系统发育的相似性(系统发育树的亲缘距离)和Spearman相关性。这四种相似性对IMPACT性能的贡献几乎相同,但我们的代谢方法是计算效率最高的一种(直接从Agora2数据库加载,无需进一步计算)。
图1显示了在低维嵌入中以类的相对丰度和代谢物产量作为空间类相似性参考的特征工程过程,用于生成图像。我们利用C架构,使用内置空间注意图的残差块来学习这些图像的空间重要区域。由于所有样本都具有相同的分类二维嵌入,分类重要度是通过平均标准计算机视觉显著性方法提取的像素特征重要度来确定的。一旦分类的重要性被提取出来,我们将这些信息与微生物数据库相关联,以研究重要分类的代谢物和功能微生物特征(如革兰氏状态)的模式。
- IMPACT: interpretable microbial phenotype analysis via microbial characteristic traits
#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格
下一篇:华为仓颉编程语言的应用案例分析
推荐阅读
留言与评论(共有 8 条评论) |
本站网友 梦见自己生了个儿子 | 30分钟前 发表 |
significantly impacts health and disease. High-throughput profiling through the advancement of modern technology provides the potential to enhance our understanding of the link between the microbiome and complex disease outcomes. However | |
本站网友 小学算术题 | 10分钟前 发表 |
与类似的方法相比 | |
本站网友 荆门婚纱摄影 | 11分钟前 发表 |
我们将这种代谢方法与其他常见的相似性进行了比较 | |
本站网友 265健康网 | 11分钟前 发表 |
作为深度学习模型的输入 | |
本站网友 老沉 | 2分钟前 发表 |
更重要的是 | |
本站网友 我告别了该死的早泄 | 16分钟前 发表 |
with a residual spatial attention transformer block architecture for phenotype classification.Results Our model | |
本站网友 薄芝片 | 22分钟前 发表 |
该框架背后的三个关键概念是:(i)分类相似性 |