精准医学和生物标志物发现的飞速发展对非靶向代谢组学提出了更高的要求。然而,现有的谱图参考库的局限性严重制约了化合物的鉴定。为克服这一瓶颈,德国联邦材料研究与测试研究所(BAM)和柏林自由大学的研究团队合作开发了FIORA,一个开源图神经网络 (GNN) 模型,用于模拟串联质谱过程,从而提升质谱识别的准确性。该研究成果已于2025年3月7日发表在《Nature Communications》上。
FIORA的核心在于其对分子键局部邻域信息的利用。通过学习化合物的断裂模式,FIORA能够预测碎离子的概率。与传统的碎裂算法ICEBERG和CFM-ID相比,FIORA在质量预测方面表现卓越,并可预测保留时间(RT)和碰撞截面 (CCS) 等其他特征。
FIORA充分利用高性能GPU,能够快速验证推定的化合物注释,并通过高质量的预测显著扩展光谱参考库。这对于推动非靶向代谢组学研究,特别是未知化合物的分析至关重要。由于高质量参考谱的匮乏,该领域在过去十年中进展缓慢。例如,2016年CASMI挑战赛中,计算机模拟方法的召回率仅为34%,而2022年甚至低于30%,这凸显了对新型解决方案的迫切需求。
FIORA的独特之处在于其对每个化合物局部结构进行独立的键解离事件评估,这比许多现有算法更直接地模拟了质谱中的物理碎裂过程。 此外,FIORA不仅在相似化合物上的表现出色,其对未知结构的泛化能力也令人瞩目。
在多个数据集上的测试结果表明,FIORA预测的质谱与参考谱的相似度中位数超过0.8,在某些情况下甚至比竞争算法高出10%到49%。其模块化设计使其能够灵活适应不同的预测目标,展现了其出色的多功能性。
FIORA的推出不仅填补了质谱分析领域的空白,也为未来的化合物鉴定和研究提供了强有力的工具。
© 版权声明:
文章版权归作者所有,未经允许请勿转载。
本文地址:https://aidh.net/kuaixun/qfgul2tv暂无评论...