單細(xì)胞分辨率的研究使我們能發(fā)現(xiàn)細(xì)胞間的細(xì)微差異,而不因樣本平均值而丟失有意義的信息。許多技術(shù)已用于研究單細(xì)胞,基于質(zhì)譜的單細(xì)胞蛋白質(zhì)組學(xué) (SCP)就是其中之一。近年來,SCP一直在不斷的改進中,細(xì)胞通量愈發(fā)提高,所以目前主要問題是當(dāng)前的技術(shù)狀態(tài)是否已準(zhǔn)備好用于廣泛生物學(xué)研究。
自2023年來,SCP已能實現(xiàn)每個單細(xì)胞超過 4,000 種蛋白質(zhì)檢測通量。目前SCP廣泛應(yīng)用的主要限制是樣本的細(xì)胞通量。與單細(xì)胞轉(zhuǎn)錄組測序相比,SCP文獻的平均捕獲細(xì)胞數(shù)量少了兩個數(shù)量級。但由于蛋白質(zhì)為是細(xì)胞功能的直接載體,且蛋白質(zhì)與RNA的表達(dá)量相關(guān)性較低,通過高通量測序技術(shù)估算蛋白質(zhì)豐度并不可靠,因此直接測量單細(xì)胞內(nèi)的蛋白質(zhì)比RNA更有意義。因此,基于質(zhì)譜的單細(xì)胞蛋白質(zhì)組學(xué) (MS-based SCP)是未來更關(guān)鍵的單細(xì)胞技術(shù),有必要評估SCP是否已準(zhǔn)備好作為生物學(xué)研究的應(yīng)用工具。
圖1. RNA并不能代表蛋白質(zhì)的豐度
從基于高通量測序的單細(xì)胞轉(zhuǎn)錄組學(xué)文獻來看,他們的共同核心可以簡化為三個基本研究策略:細(xì)胞注釋、發(fā)育軌跡和空間映射。2024年7月美國楊百翰大學(xué)研究團隊在期刊Journal of Proteome Research發(fā)表文章,以評估單細(xì)胞蛋白質(zhì)組學(xué)目前是否已準(zhǔn)備好應(yīng)用于廣泛的生物學(xué)研究。本文的主要研究點就在于從這三個研究策略評估SCP的應(yīng)用水平。
圖2.評估單細(xì)胞蛋白質(zhì)組學(xué)應(yīng)用水平的三個研究策略
假設(shè)有一堆由黃豆、綠豆、紅豆組成混合豆子,隨便拿起一顆,通過視覺判斷就知道是哪種豆子,這是通過顏色進行的豆子注釋。類似地,從組織解離得到的單細(xì)胞懸液里,也包含各種類型的細(xì)胞,而我們可以通過細(xì)胞表達(dá)的特征基因進行細(xì)胞注釋,以將檢測到的每一個細(xì)胞都進行分門別類。細(xì)胞注釋通常需要數(shù)據(jù)庫來提供各種細(xì)胞的特征基因,比如CellMarker數(shù)據(jù)庫。SCP可以利用目前已有的數(shù)據(jù)庫進行細(xì)胞注釋,且經(jīng)過驗證發(fā)現(xiàn)細(xì)胞注釋效率和精度高于scRNA-Seq。
圖3.SCP細(xì)胞注釋更細(xì)致和準(zhǔn)確
為了給下游分析提供有意義的注釋,SCP需要足夠的細(xì)胞通量和蛋白組學(xué)深度。但具體是多少呢?作者概括了在分析時必須考慮的幾個因素:
捕獲的細(xì)胞數(shù)量;
每個細(xì)胞的蛋白檢測深度;
批次效應(yīng);
Double-Dipping數(shù)據(jù)重復(fù)使用。
SCP分析需要的細(xì)胞數(shù)量取決于許多參數(shù)(所需細(xì)胞類型的預(yù)期稀有性/濃度、預(yù)期樣本脫落/存活率等),作者以白細(xì)胞主要亞型為例,演示如何估算需要采樣的細(xì)胞數(shù)量:假如在一份樣本中細(xì)胞占比為中性粒細(xì)胞(62%)、淋巴細(xì)胞(30%)、單核細(xì)胞(5.3%)、嗜酸性粒細(xì)胞(2.3%)和嗜堿性粒細(xì)胞(0.4%),為了確保最稀有的嗜堿性粒細(xì)胞能被注釋到,設(shè)定需要至少5個細(xì)胞被捕獲。假設(shè)從樣本中隨機抽取細(xì)胞,則需要 3,274 個細(xì)胞才能有99%的概率成功對最稀有的細(xì)胞類型進行至少 5 次采樣,考慮到細(xì)胞質(zhì)控的過濾規(guī)則,設(shè)定1%為損耗,則至少需要3,308 個細(xì)胞被捕獲。因此,細(xì)胞通量是 SCP 中細(xì)胞注釋的一大難點。
注:n表示細(xì)胞總數(shù),x表示成功次數(shù),k表示所需的最小成功次數(shù),p表示成功事件的概率,P表示總體概率
注:n表示細(xì)胞數(shù)量,d表示細(xì)胞質(zhì)控?fù)p失率,nadj表示需要采集的質(zhì)控過濾后細(xì)胞數(shù)量
細(xì)胞注釋所需的蛋白質(zhì)組學(xué)深度并不容易計算,這取決于目的細(xì)胞類型以及特征蛋白的豐度。目前,SCP通常檢測到細(xì)胞內(nèi)較豐富的蛋白,因為在實際情況中被測蛋白是隨機采樣的。隨著深度的增加,SCP文獻中報道了更多中低豐度蛋白。從細(xì)胞注釋原理來說,絕大部分情況是基于單個蛋白陽性或陰性進行的,比如CD4+T細(xì)胞,CD4蛋白分子的豐度已經(jīng)足夠區(qū)分這個亞群。但少數(shù)的細(xì)胞類型依靠低豐度蛋白進行注釋,原因是一方面這些細(xì)胞占比可能很低,另一方面可能是蛋白本身表達(dá)較低但亞群特異性高。而在公開的數(shù)據(jù)中,已經(jīng)證實了基于蛋白表達(dá)的細(xì)胞注釋遠(yuǎn)比基于RNA的注釋更準(zhǔn)確,更能注釋稀有細(xì)胞亞群。而目前SCP 覆蓋的深度(4000+蛋白質(zhì))與 scRNA-Seq的覆蓋深度相當(dāng)甚至超過,具體取決于技術(shù)平臺、細(xì)胞類型等。
許多基礎(chǔ)分析如細(xì)胞注釋的前提是假設(shè)豐度值可以在樣本間進行比較。批次效應(yīng)是一種技術(shù)噪聲,它會導(dǎo)致蛋白豐度產(chǎn)生偏移,令數(shù)據(jù)無法在樣本之間直接比較。在 SCP 中,批次效應(yīng)也是阻礙分析進度的一座大山,但質(zhì)譜檢測有一個好處,在實驗條件不變的情況下,可以使用內(nèi)標(biāo)或外標(biāo)校準(zhǔn)樣品之間的蛋白豐度值。這是scRNA-Seq無法做到的一點。
生物體從胚胎時期一個受精卵開始發(fā)育,細(xì)胞經(jīng)過不斷分裂壯大數(shù)量,經(jīng)過不斷分化各司其職。比如免疫學(xué)上的T細(xì)胞包括CD4+T細(xì)胞、CD8+T細(xì)胞等,這些T細(xì)胞均由幼稚T細(xì)胞分化發(fā)育而來。在單細(xì)胞層面看來,生物體內(nèi)正在發(fā)育的細(xì)胞可以觀察到中間分化階段的連續(xù)分布,比如從幼稚T細(xì)胞→幼稚CD4+T細(xì)胞→Treg細(xì)胞,這稱為發(fā)育軌跡。根據(jù)定義,細(xì)胞注釋不允許漸進的連續(xù)細(xì)胞分布,所以通過單細(xì)胞軌跡分析得到細(xì)胞發(fā)育路徑,也是SCP的重要分析之一。
軌跡分析是單細(xì)胞水平的特色分析手段。在scRNA-Seq中,常用的分析工具包括monocle2、GeneSwitch、PAGA等,核心原理都是通過一些特征基因表達(dá)模式的改變判斷細(xì)胞在分化路徑上的位置。然而,轉(zhuǎn)錄層面的改變并不完全代表蛋白豐度的變化,特別是在單細(xì)胞水平。所以,在SCP中進行軌跡分析顯得尤為重要。
將軌跡分析用于SCP,需要足夠的細(xì)胞通量與合適的分析工具。下面概述了在發(fā)育軌跡推斷分析中 SCP 數(shù)據(jù)的三個重要考慮因素:
捕獲的細(xì)胞數(shù)量;
SCP 軌跡推斷工具的可用性;
Double-Dipping數(shù)據(jù)重復(fù)使用。
如果軌跡的所有階段同時出現(xiàn)在一個樣本中(例如,骨髓樣本中的造血細(xì)胞發(fā)育),那么對樣本中的細(xì)胞進行充分采樣可以捕捉到所有的細(xì)胞發(fā)育狀態(tài),這里的“充分”就是關(guān)鍵。所需的確切細(xì)胞數(shù)量取決于三個因素,構(gòu)建軌跡的復(fù)雜性、過渡狀態(tài)的數(shù)量以及細(xì)胞在每個狀態(tài)下所花的時間。采樣策略必須考慮在發(fā)育的單個時刻、軌跡上以及生物重復(fù)之間捕捉細(xì)胞多樣性的方法。由于目前 SCP 的細(xì)胞通量較為有限,因此在實驗設(shè)計中需要在每條軌跡的細(xì)胞數(shù)量和軌跡的重復(fù)數(shù)量之間進行權(quán)衡(如下圖)。重復(fù)的軌跡可以幫助我們確定軌跡的推斷結(jié)構(gòu),以及軌跡在多個樣本間是否成立,但細(xì)胞數(shù)量少可能導(dǎo)致軌跡準(zhǔn)確度下降。為此,Boekweg 等人開發(fā)了一個基于軌跡的功效分析框架,并模擬了實驗中的真正陽性和假陽性發(fā)現(xiàn)率(DOI: 10.1016/j.mcpro.2021.100085)。
圖 4. 在發(fā)育軌跡實驗中平衡每次重復(fù)的細(xì)胞數(shù)量和重復(fù)次數(shù)。例如可以制作一個 200 個細(xì)胞的軌跡 (a),或者可以制作四個 50 個細(xì)胞的軌跡 (b)。
目前常用的軌跡分析軟件是為scRNA-Seq開發(fā)的,可以適用于其他類型包括SCP的數(shù)據(jù)。但也有例外——RNA velocity——通過分析未剪接和剪接RNA的比例獲取細(xì)胞發(fā)育軌跡,常見的蛋白質(zhì)組學(xué)流程不會模擬“未成熟”的蛋白質(zhì)。
空間映射是在組織的空間層面進行原位分子檢測。最早的空間映射方法是免疫染色法,使用染色劑對組織切片進行分子標(biāo)記,再通過顯微鏡觀察被標(biāo)記的程度和位置。但這樣的方法檢測通量很低,且會受到分子特異性的影響。隨著 MALDI-MS 、 LCM-MS 等技術(shù)的出現(xiàn),細(xì)胞內(nèi)的無偏分子測量應(yīng)運而生,通過獲取組織“像素級”的質(zhì)譜圖并對整個樣本進行分析。
目前,空間蛋白質(zhì)組學(xué)采用兩種常見的實驗設(shè)計:MALDI 和LCM激光捕獲顯微切割。這兩種技術(shù)都需要權(quán)衡數(shù)據(jù)采集速度和蛋白檢測深度。
圖5. 兩種蛋白質(zhì)組學(xué)空間映射技術(shù)的功能比較
MALDI 在質(zhì)譜成像方面有著悠久的歷史,在原位進行樣本局部破壞以快速的質(zhì)譜檢測,原理決定了這項技術(shù)在高空間分辨率下使用時靈敏度會較低,且難以獲取大量離子的 MS2 信息,導(dǎo)致蛋白檢測深度較低。激光捕獲顯微切割與質(zhì)譜聯(lián)用(LCM-MS)使用激光從樣本中手動切割出單個目標(biāo)區(qū)域,再進行單獨的蛋白質(zhì)組學(xué)檢測。LCM-MS可以切割任何感興趣的區(qū)域,包括單個細(xì)胞的精確邊界或亞細(xì)胞位置,且由于是單獨進行的質(zhì)譜檢測,LCM-MS的蛋白檢測深度很高,可以對樣品進行深入探究。
類比scRNA-Seq與空間轉(zhuǎn)錄組學(xué),SCP也可以對空間蛋白質(zhì)組學(xué)結(jié)果進行空間映射,以提高空間分群的準(zhǔn)確性。但同時也存在兩個重要考慮因素:
樣本的分辨率;
樣本數(shù)量。
在對組織切片進行空間分析時,空間分辨率很重要。LCM可以切出單個細(xì)胞或者剪切出任意形狀和大小的較大區(qū)域,區(qū)域越大,包含的肽越多,質(zhì)譜信號就越強。例如1個細(xì)胞和 10 個細(xì)胞,或一個神經(jīng)元和一個上皮細(xì)胞,識別的肽段數(shù)量差很多。但區(qū)域越大,分辨率越低,顯然也是需要衡量的一個因素。
在 SCP 中,獲取的樣本數(shù)量也是一個重要的參數(shù)。在空間轉(zhuǎn)錄組學(xué)中,市售平臺具有標(biāo)準(zhǔn)化的空間分辨率和幾何形狀,例如 10X Visium 平臺每張載玻片包含 5,000 個Spot。然而,在空間蛋白質(zhì)組學(xué)中,商業(yè)平臺較少,實驗設(shè)計以適合研究目的為主要,具有較大的自由度。青蓮百奧可以為您提供全流程一站式的空間蛋白組學(xué)服務(wù),從樣品準(zhǔn)備到目標(biāo)區(qū)域選取,從蛋白檢測到數(shù)據(jù)分析,提供個性化解決方案,可接受OCT包埋或FFPE樣本。而且國內(nèi)首篇空間蛋白組學(xué)文章——SCP構(gòu)建人類皮膚的細(xì)胞空間圖譜(北京協(xié)和醫(yī)學(xué)院,DOI: 10.1038/s41467-022-31659-9)——由青蓮百奧提供空間蛋白組學(xué)服務(wù)。
過去十年,單細(xì)胞技術(shù)蓬勃發(fā)展,各種方法可以越來越詳細(xì)地表征 DNA、RNA 和蛋白質(zhì)?;谫|(zhì)譜的單細(xì)胞蛋白質(zhì)組學(xué)在生物學(xué)研究中具有巨大潛力。上述三種研究策略(細(xì)胞注釋、發(fā)育軌跡和空間映射)均涉及權(quán)衡問題,除非 SCP 的細(xì)胞通量能大幅提高。在細(xì)胞注釋中,包括所需捕獲的細(xì)胞數(shù)量,以及如何設(shè)置實驗以使批次效應(yīng)不會掩蓋本身的差異。在發(fā)育軌跡中,包括構(gòu)建軌跡需要的細(xì)胞數(shù)量,以及生物學(xué)重復(fù)的數(shù)量。在空間映射中,包括在樣本分辨率和所需樣本數(shù)量之間進行權(quán)衡。
參考文獻:
[1] Nitz AA, Giraldez Chavez JH, Eliason ZG, Payne SH. Are We There Yet? Assessing the Readiness of Single-Cell Proteomics to Answer Biological Hypotheses. J Proteome Res. 2024 Jul 9.
[2] Schwanh?usser B, Busse D, Li N, et al. Global quantification of mammalian gene expression control. Nature. 2011 May 19;473(7347):337-42.
[3] Gray GK, Li CM, Rosenbluth JM, et al. A human breast atlas integrating single-cell proteomics and transcriptomics. Dev Cell. 2022 Jun 6;57(11):1400-1420.e7.
@2024北京青蓮百奧生物科技有限公司 京ICP備17052224號