異質性是惡性腫瘤等疾病的重要特征,是精準醫(yī)學需破解的難題。疾病異質性可表現(xiàn)為不同的病理類型以及不同的基因突變譜、轉錄組表達譜和蛋白質組表達譜等,是惡性腫瘤等疾病發(fā)生發(fā)展領域長期關注的科學問題。
異質性的存在使得對疾病進行分型成為精確醫(yī)學的關鍵步驟。疾病分型的傳統(tǒng)方法基于形態(tài)學特征,依賴對病理切片的觀察與分析。隨著分子檢測技術的不斷成熟,基于分子特征的疾病分型方法受到廣泛關注。二十世紀末美國國立癌癥研究所首次提出了腫瘤分子分型的概念。研究人員利用組學技術深入剖析疾病分子水平的異質性,從而指導疾病的精準診斷與治療。
目前基因分型已實現(xiàn)臨床轉化,然而尚無真正意義的基因治療藥物,且基于基因檢測的靶向治療藥物的受益人群占比極低。2021年發(fā)表于Cell 期刊的觀點文章[1]指出了在精準腫瘤學領域基因組學的局限性與蛋白質組學的重要作用。相較而言,蛋白質組學更接近表型,且基于蛋白質組學的靶向治療能夠實現(xiàn)精準施策。
利用蛋白質組數(shù)據(jù)將疾病樣本劃分多個亞型,剖析不同亞型蛋白質水平的異質性,有助于理解疾病的發(fā)生機制,從而指導針對不同亞型的精準治療。下面就讓我們一起來看看基于蛋白質組學的疾病分子分型研究是如何實現(xiàn)的吧~
基于蛋白質組學的疾病分子分型研究總覽[2]
收集合適的樣本對于基于蛋白質組學的疾病分子分型研究的科學性至關重要,文章中常見的樣本為臨床組織樣本或體液樣本。
臨床組織樣本是疾病分子分型研究中樣本收集的經(jīng)典選擇。這種樣本選擇策略能夠更好地保證生物學意義,為相應疾病提供寶貴的數(shù)據(jù)資源,獲得更準確的分子分型結果。2024年發(fā)表于Cell 期刊的文章[2]以小細胞肺癌為研究對象,收集了來自臨床隊列的腫瘤組織和配對癌旁組織,基于組學數(shù)據(jù)將小細胞肺癌分為四個亞型,系統(tǒng)表征各亞型獨特的分子特征并提出潛在治療策略。
臨床體液樣本也可作為疾病分子分型研究中的樣本選擇。2023年發(fā)表于Arthritis Rheumatol期刊的文章[3]以白塞病為研究對象,收集了來自臨床隊列的血漿樣本,基于組學數(shù)據(jù)將白塞病分為三個亞型,推動了個體化治療策略建立。
作為國內領先的蛋白質組學平臺,青蓮百奧針對疾病分子分型研究開發(fā)了完整解決方案,下面就來看看基于蛋白質組學數(shù)據(jù)的疾病分子分型解決方案是怎么實現(xiàn)的吧~
數(shù)據(jù)預處理
數(shù)據(jù)分析前需要對數(shù)據(jù)進行標準化處理,對數(shù)據(jù)依次進行樣本剔除、蛋白剔以及缺失值填補,處理方法和標準如下:
樣本剔除:剔除鑒定到的蛋白個數(shù)小于100個的樣本。
蛋白剔除:剔除在50%的樣本中存在缺失值的蛋白。
缺失值填補:缺失值采用全局最小值進行填補。
特征選擇
預處理后的蛋白表達矩陣,首先進行分型分子特征篩選。常見的特征篩選指標包括基于變異系數(shù)(CV)、絕對中位差(MAD)、標準差(SD),篩選在不同樣本間存在差異的特征。
分子分型
蛋白表達矩陣篩選分子特征后,采用非負矩陣分解(Non-Negative Matrix Factorization,NMF)算法進行分子分型。NMF是一種無監(jiān)督學習技術,相較于傳統(tǒng)層次聚類更準確。通過NMF聚類,可以發(fā)現(xiàn)差異蛋白矩陣中存在的亞組結構,并了解不同亞組之間的差異。
Cophenetic值是一種衡量聚類質量的指標,用于評估聚類算法產(chǎn)生的聚類結果與原始數(shù)據(jù)之間的相似程度,顯示了聚類的擬合優(yōu)度。
分子分型結果熱圖:根據(jù)Cophenetic值判斷最佳聚類個數(shù)K,選取Cophenetic值變化的最大變動的前點為最佳聚類個數(shù),繪制聚類熱圖,并計算輪廓(Silhouette)系數(shù)來評估聚類的好壞。
分子分型結果評估:Silhouette準則是一種用于聚類分析中的評價方法。Silhouette系數(shù)的取值范圍在–1到1之間,其中負值表示數(shù)據(jù)點更容易被分類到錯誤的簇中,而正值則表示數(shù)據(jù)點更容易被正確分類。因此,Silhouette準則的目標是最大化Silhouette系數(shù)的平均值,從而找到最佳的聚類數(shù)量。
亞型分子特征
得到分子分型結果后,通過整合分型結果與臨床指標的關聯(lián),實現(xiàn)對分子分型結果進行臨床解釋。通過分析亞型特征和功能分析,可以實現(xiàn)針對不同亞型的精準化治療方案制定。
亞型差異蛋白熱圖:根據(jù)分型結果篩選各亞型間具有顯著差異表達的蛋白(篩選條件:Mann Whitney U-test P-value<0.05且 |Log2(Fold-Change)| >1),聯(lián)合臨床指標繪制熱圖。
亞型差異蛋白富集分析:對不同亞型間具有顯著差異表達的蛋白進行KEGG富集分析,探究不同亞型的分子功能。
亞型預后分析:若有臨床預后信息,則可根據(jù)分子分型結果,進行Log-rank檢驗,繪制生存曲線,比較組間生存差異。
臨床信息與亞型關聯(lián)的預后分析:根據(jù)分子分型結果以及臨床信息,進行多因素Cox回歸分析,并以森林圖的形式進行可視化。
通過以上流程,能夠實現(xiàn)可靠的基于蛋白質組學的疾病分子分型研究。此外,青蓮百奧針對隊列樣本研究瓶頸,還獨家推出疾病生物標志物篩選、預后標志物篩選高級分析報告。步驟雖繁必不敢省人工,試劑雖貴必不敢減物力,疾病生物標志物篩選、預后標志物篩選解決方案已在過去兩天與大家見面,之后的推送也將為大家?guī)砀嗟母韶浗庾x,敬請期待~
@2024北京青蓮百奧生物科技有限公司 京ICP備17052224號