DIA定量技术入门之一:DIA和SWATH-MS的“历史渊源”

2026-02-23 12:33:51

世界杯足球球队排名

数据非依赖采集(DIA)的基本原理是不管某个肽段的母离子是否能够检测到,采集所有能够采集的碎片离子信息。这个概念最早由Masselon等在2000...

数据非依赖采集(DIA)的基本原理是不管某个肽段的母离子是否能够检测到,采集所有能够采集的碎片离子信息。这个概念最早由Masselon等在2000年作为一个论证原理的研究发表(Masselon等,2000)。很快就有多个课题组进一步发展了这个理念并实现了同时碎裂了所有肽段(Bateman等,2002; Purvine等,2003),且利用了顺序提取母离子窗口的技术(Venable等,2004)。其后,研究者探索开发了多种不同的DIA方法,数据采集方式及分析方式 (Carvalho等,2010; Egertson等,2013; Geiger等,2010; Gillet等,2012; Panchaud等,2011; Panchaud等,2009; Plumb等,2006; Purvine等,2003; Silva等,2005; Venable等,2004; Weisbrod等,2012) 。这些方法主要在使用的质谱型号上,采集参数上和数据分析策略上有所不同。近期的一些综述比较了不同的DIA技术并讨论了各自的优缺点 (Chapman等,2014; Law & Lim,2013; Meyer & Schilling,2017; Sajic等,2015)。

“DIA”的定义最早由Venable在2004年提出(Venable等,2004),和数据依赖性采集技术 (DDA) 不同点在于DDA需要选择特定母离子进行碎裂。最初,DIA数据分析用的和DDA数据类似的搜库方法,要么是搜索混合MS2谱图(Panchaud等,2009; Venable等,2004) 或者搜索共流出的母离子信息构建的虚拟MS2谱图(Bern等,2010; Geromanos等,2009; Li等,2009)。在2012年,DIA数据分析的全新策略由Gillet提出,通过预构建谱图库来帮助进行DIA数据分析 (Gillet等,2012)。类似于靶向蛋白质组学的选择/多重反应检测方法,Gillet采用连续采集色谱流出的同一个肽段的碎片离子,并对预先采集的谱图数据库里具有可匹配的质谱、色谱参数的多肽信息进行数据挖掘来得到定性结果。作者将该方法类比为地球物理学中相关的卫星或飞行器采集地球表面图像数据的方法,命名为SWATH-MS,swaths意为这些采集的图像可以通过电脑模拟还原为地球的一整幅图像。在SWATH-MS中,“swath”意为以由质谱选定一个特定母离子隔离窗口范围,对一系列肽段质量范围内的所有离子进行碎裂。

受益于数据分析和质谱采集速度、质量精度和分辨率的显著进步,最近几年来对DIA领域的研究兴趣和研究数量大大增加(Doerr,2015)。涌现出了大量的DIA技术改进方法(图1)和多个自动化DIA数据分析工具(Bilbao等,2015)。这些进步使得蛋白质组学实验室逐渐将高质量的DIA检测纳入常规检测实验中并成功的应用于不同领域的研究中(Aebersold等,2016)。

DIA以采集和数据分析策略不同来区分,有着多种命名。不少命名是由质谱厂商申请的商标而定。本文中我们以DIA来定义这项技术,而当我们提到 “SWATH-MS”时,具体指的是由Gillet等提出的特定的采集技术和分析方法(Gillet等,2012)。

图1: DIA方法的历史发展及其对应的隔离窗口大小

自2000年初DIA技术开始兴起后,各种DIA方法的不同点在于其采集来源的质谱仪器差异、数据分析策略和特定的隔离窗口大小不同。随着仪器采集速度和分辨率的技术进步,最近几年来科学家对DIA的研究兴趣日益浓厚。多个新的中等母离子隔离窗口(4-100m/z)的技术被陆续提出。

参考文献: Shotgun-CID (Purvine等,2003),Original DIA (Venable等,2004) ,MSE (Silva等,2006),PAcIFIC (Panchaud等,2009),XDIA (Carvalho等,2010),AIF (Geiger等,2010),SWATH-MS (Gillet等,2012),FT-ARM (Weisbrod等,2012),HDMSE (Geromanos等,2012),MSX (Egertson等,2013),pSMART (Prakash等,2014),WiSIM-DIA (Martin等,2016),UDMSE (Distler等,2014),HRM (Bruderer等,2015),variable window SWATH-MS (Zhang等,2015),SONAR (Moseley等,2018)。

图2 使用略微重叠母离子隔离窗口的基本原理 (A) 在最早的SWATH‐MS实现方法中, 相邻SWATH窗口采用了1个m/z重叠,从而避免了隔离窗口边界上的离子传输效率下降的问题 (B) 并且将两个窗口间的母离子的同位素峰割裂效应降低 (C和D)。(B)离子传输效率问题的一个示意图,以[500–526] m/z的离子范围在目前最新的四级杆质量分析器中检测情况为例(C) Theoretical isotopic distribution of the doubly charged peptide 两电荷肽段MLSYPITIGSLLHK (m/z = 524.965)理论同位素分布情况。如果采用无重叠,其同位素峰在被分隔的同时,在两个窗口内都会落在离子传输效率低下的范围内。[有效离子传输窗口是 (500.5–524.5)和(525.5–549.5)]。 即使将窗口边缘放置到没有母离子的位置(如525.1),离子传输效率下降和同位素峰割裂的情况依然存在。(D) 重叠窗口采集[(499–525)和(524–550)]时,大部分母离子都将处于四级杆不损失传输效率的范围内,[如有效窗口为(499.5–524.5)和(524.5–549.5)]。