久热久草在线_一一高清视频在线观看_在线观看91av_久草免费在线观看视频_国产精品午夜无码A体验区_国产一级高清

English | 中文版 | 手機版 企業登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術文章 > 時空組學研究進展(六):單細胞多組學測序技術的介紹

時空組學研究進展(六):單細胞多組學測序技術的介紹

瀏覽次數:788 發布日期:2025-1-24  來源:本站 僅供參考,謝絕轉載,否則責任自負

 
期刊:Science China-Life Sciences
影響因子:8.0
常規多組學技術,目前已被廣泛應用于疾病發展、組織發育等研究領域。在單細胞水平,從相同或相似來源的不同細胞中獲取多種組學信息,通過單細胞轉錄組鑒定細胞類型后關聯到其他相似細胞的不同組學層面,以發現新的細胞亞群和新的生物學機制。測序技術的高速發展使得在單細胞分辨率下檢測同一細胞中的DNA、mRNA、表觀基因組和蛋白質組等信息成為可能。

為了整合單細胞多組學數據,目前已經開發了多種生物信息學算法。在本章中,作者回顧了:
(1)捕獲同一細胞的單細胞多組學技術的最新發展,主要集中在以轉錄組為核心的多組學技術(表3);
(2)多組學數據整合分析方法和工具的最新進展,包括針對未配對多組學數據集和配對多組學數據集的應用和算法;
(3)總結單細胞多組學整合分析基準研究中數據整合方法的性能。
 


單細胞多組學測序技術
通過單細胞多組學技術,可以分析同一細胞的多種類型的分子。近年來,人們開發了多種單細胞測序方法,用于捕獲基因組DNA(gDNA)、轉錄組、蛋白質組和表觀基因組。單細胞多組學測序技術工作流程的主要步驟如圖13所示。
 

圖13 單細胞多組學測序技術的主要實驗流程


1. 轉錄組+gDNA
目前已有多種技術可以同時測量單個細胞中的mRNA和gDNA。G&T-seq(Genome and transcriptome sequencing)應用流式細胞術分離細胞,使用beads分離細胞中的mRNA和gDNA。DR-seq(gDNA-mRNA sequencing)通過移液管分選細胞,然后分離和擴增標記的gDNA和mRNA。SIDR技術 (Simultaneous isolation of genomic DNA and total RNA)使用微孔板分選細胞,并通過低滲胞飲法分離細胞核和細胞質。TARGET-seq技術優化了FACS的細胞分離和逆轉錄聚合酶鏈反應(RT-PCR)擴增步驟,提高了細胞通量。

2. 轉錄組+表觀基因組
亞硫酸氫鹽(BS)處理可以轉化發生甲基化和未發生甲基化的DNA CG位點,并通過PCR和二代測序在單核苷酸分辨率上分析DNA甲基化。基于該原理,目前已經開發了多種單細胞甲基化測序技術,用于檢測單細胞水平上的甲基化修飾水平,包括scRRBS、scWGBS、snmC-seq和sci-MET。同樣的,目前已開發多種單細胞多組學技術,捕獲同一細胞中的mRNA和gDNA的甲基化。首先,scM&T -seq(single-cell methylome and transcriptome sequencing)使用與G&T-seq類似的方法,利用流式分離細胞,基于beads分離細胞的mRNA和gDNA,然后進行亞硫酸氫鹽處理。scMT-seq(simultaneous single-cell methylome and transcriptome sequencing)使用微量移液法從單細胞裂解物中分離細胞核,并通過scRRBS和改良的Smart-seq2流程分別生成DNA甲基化和轉錄組數據。此外,scTrio-seq可以分析同一細胞中的基因組CNVs、DNA甲基化和轉錄組,其中基因組CNVs可以通過大量RRBS數據從scRRBS中計算推斷出來。

多種基于二代測序的技術,如ChIPseq、Dnase -seq、ATAC-seq,用于研究表觀基因組圖譜,如染色質結構和組蛋白修飾。另一種類似的方法,NOMe-Seq (Nucleosome Occupancy and Methylome Sequencing)可以使用外源性M. CviPI GpC甲基轉移酶標記開放的基因組區域,同時測定核小體占位和甲基化水平。在這些方法的基礎上,還開發了許多新的技術來測量染色質可及性、DNA甲基化或單細胞分辨率下染色質可及位點的組蛋白修飾,如scDNase-seq、sci-ATAC seq、scATAC-seq、scMNase-seq、scChIP-seq等,可以檢測H3K4me3和H3K4me2修飾。

基于這些技術,開發了多種聯合檢測染色質可及性和轉錄組的單細胞多組學高通量方法。Cao等人(2018)開發了sci-CAR,是第一個可以同時分析同一細胞中mRNA和ATAC的技術。Sci-CAR對每個細胞進行組合索引,通過FACs分離細胞,裂解后進行擴增測序。Cao等人(2018)將sci-CAR技術應用于人類和小鼠細胞系混合物以及小鼠腎組織,并從聯合分析數據集中確定了順式調控網絡。然而,由于scATAC數據模式的高稀疏性和scRNA模式測序深度有限,在sci-CAR數據集中只能重現少數其他scRNA 和 scATAC 測序中的差異可及位點和差異表達基因。Chen等(2019d)開發了基于液滴的SNARE-seq(single-nucleus chromatin accessibility and mRNA expression sequencing),增強了scRNA和scATAC的測序覆蓋范圍,并改善了sci-CAR技術的覆蓋限制。SNARE-seq使用夾板寡核苷酸,其序列與 ATAC 轉座酶插入的接頭序列(5' 端)和 mRNA polyA序列互補,可以捕獲兩個組學數據。與 sci-CAR 相比,SNARE-seq 在小鼠腦數據集和成人腦數據集中檢測到的染色質可及位點是 sciCAR 組織數據集的4-5倍,并通過細胞組合索引策略提高了檢測通量。Zhu等(2019b)進一步完善了該方案,開發了Paired-seq,通過測序同時檢測單個細胞中的RNA表達和DNA可及性。其主要是采用基于連接的組合索引策略,通過 Tn5 轉座酶切割開放染色質片段,通過RNA反轉錄得到cDNA 分子。使用Paired-seq技術檢測小鼠胚胎大腦皮層組織,并與ENCODE小鼠胚胎大腦皮層組織數據集進行整合分析,重建細胞軌跡,并從雙組學數據集中恢復了順式調控網絡。Ma等人(2020)開發了SHARE-seq技術(simultaneous high-throughput ATAC and RNA expression with sequencing),該方法使用多輪雜交阻斷來聯合標記同一單細胞中的mRNA和染色質片段。與sciCAR、SNARE-seq和Paired-seq相比,SHARE-seq在超過30,000個細胞的更大文庫上具有更高的可擴展性,并且在每個細胞中檢測到更多的基因和ATAC peak時具有更高的靈敏度;诟叩臄祿|量,Ma等人給出了一個新的計算策略DORCs(domains of regulatory chromatin,調控染色質域),而不是單個峰來分析染色質可及性和基因表達之間的調控圖譜,DORCs在細胞譜系選擇和細胞命運決定中優于基因表達,可以更好的預測細胞命運。最近,10x Genomics 開發了10x Multiome,一個用于單細胞中scRNA和scATAC聯合檢測的商業服務平臺,這將加速scRNA和scATAC多組學技術在更多生物學和臨床研究中的應用。

3. 轉錄組+蛋白組
除了針對DNA和RNA的單細胞多組學,還開發了多種可以同時測量同一細胞中RNA和蛋白質的單細胞技術。PEA/STA技術(proximity extension assay/specific RNA target amplification)使用逆轉錄酶作為DNA聚合酶,用于RNA的反轉錄和38種蛋白PEA中DNA寡核苷酸的延伸,以使cDNA合成和PEA能夠同時在 Fluidigm C1 TM 系統中進行。PLAYR(proximity ligation assay for RNA)技術是一種使用流式細胞術和質譜流式細胞技術進行多重轉錄物定量的方法,與標準抗體染色兼容。PLAYR允許同時測量40多種mRNA和蛋白質,并能夠在單細胞水平上表征轉錄和翻譯之間的相互作用。除了蛋白-RNA聯合檢測外,還開發了兩種靶向表面蛋白和mRNA的方法:CITE-seq和REAP-seq,這兩種技術使用寡核苷酸標記的抗體檢測mRNA和細胞表面蛋白,并通過基于液滴的單細胞測序方法實現單細胞水平的多組學分析,極大地提高了轉錄組的通量。例如,REAP-seq可以用82種抗體定量蛋白質,并在一次實驗中檢測超過20,000個基因。RAID(single-cell RNA and immunodetection)可以檢測細胞內蛋白和磷酸化蛋白以及mRNA。RAID用連接RNA條形碼的抗體對細胞內靶蛋白進行免疫標記,然后將蛋白轉化為RNA。

4. 捕獲兩種以上組學的技術
基于上面討論的方法,還開發了多種方法檢測同一個細胞中兩個以上的組學。scNMT-seq(Single-cell nucleosome, methylation and transcription sequencing)將scM&T-seq和NOMe-seq相結合,用于測量同一細胞中的核小體、轉錄組和DNA甲基化信息。scNOMeRe-seq,能夠在同一個細胞中分析全基因組染色質可及性、DNA甲基化和轉錄組;贑ITE-seq,開發了ECCITE-seq(Expanded CRISPR-compatible Cellular Indexing of Transcriptomes and Epitopes by sequencing),可以同時檢測單細胞中的蛋白、轉錄組、克隆型和CRISPR信息。通過整合pair -seq與CUT&Tag技術,開發了Paired-Tag技術,可以同時分析同一細胞中scRNA,scATAC和五種組蛋白修飾。scCUT&Tag-pro技術,也是將CUT&Tag與CITE-seq結合,通過CUT&Tag文庫捕獲5個組蛋白修飾,通過抗體衍生蛋白標簽文庫捕獲蛋白質。

多組學整合分析
單細胞多組學技術的發展為多視角、多維度、高分辨率的揭示分子機制提供了豐富的數據資源。然而,由于數據維數高、數據稀疏度高以及多組學數據集和技術之間變量復雜等問題,難以對多組學數據集進行正確的整合分析。目前越來越多的算法被開發出來,本文從以下兩個角度介紹了多組學整合分析算法和相關研究,包括(1)多組學整合工具的類別,其中介紹了最近發表的單細胞多組學整合工具,并按照不同的分類標準進行分類;(2)最近發表的工具的基準研究。

1. 多組學整合工具的分類
基于之前的綜述論文,可以應用幾個標準對多組學整合工具進行分類。首先,基于數據集的共同特征(稱為錨點)的選擇,多組學整合分析可以分為四種主要的整合策略,包括以所有基因組特征(如基因)為錨點的水平整合,以所有共同細胞為錨點的垂直整合,無共享特征的對角線整合以及以部分共享細胞和部分共享基因組特征為錨點的馬賽克整合。具有相似方法學的工具也可能被開發為不同類型。例如,對于基于非負矩陣分解 (NMF) 的算法,iNMF被設計為垂直整合工具,coupledNMF被設計為對角線整合工具,UINMF被設計為馬賽克整合工具。

其次,多組學整合工具也可以根據多組學技術的類型分類,包括“配對”和“非配對”整合工具。配對的多組學整合工具是專門為同時從同一細胞捕獲和測序的多組學數據集而設計的。配對整合工具通常采用垂直整合和鑲嵌整合策略,因為配對數據集在不同組學之間共享全部或部分細胞。非配對整合工具旨在整合來自不同細胞的多種單細胞組學數據,因為一種組學的細胞無法從其他組學中找到匹配的細胞。由于細胞和基因的差異,對角線整合通常用于非成對數據整合。針對配對或非配對多組學數據集整合,開發了一些工具。例如,Seurat v3是為未配對的多組學數據集設計的,而更新版本Seurat v4是專門為配對的多組學數據集設計的。一些整合工具可以同時應用于成對和非成對的多組學數據集。

第三,基于方法論,多組學整合工具可以分為:數學矩陣分解方法、流形對齊方法、基于網絡的方法和深度學習方法。深度學習整合工具可以根據深度模型的基礎結構進一步分類,包括自編碼器(AE)、生成對抗網絡(GAN)、GNN及其擴展結構,如變分自編碼器(VAE)。選擇哪種方法很大程度上取決于多組學數據集的類型和整合目的。對于未配對的多組學數據集,流形對齊方法可以首先將多組學數據集的不同特征降低到同一維度的潛在嵌入/流形中,然后通過相同的流形整合異構組學。同樣,矩陣分解方法可以通過將不匹配的基因或細胞矩陣分解為相同維度的矩陣以應用于不同的整合任務,與簡單的降維方法以及流形對齊相比,信息損失更少。使用GAN, VAE和transformer的深度學習工具可以從相同細胞或共享細胞的不同組學中學習到共同的潛在嵌入信息,然后填補缺失的細胞和基因,如GNN模型用于學習不同類型的特征(如scRNA中的基因和scATAC中的peak等)之間的關系,并推斷多組學數據中的生物網絡。

第四,根據特定的組學對多組學整合工具進行分類。針對特定的多組學數據集整合,設計了一些多組學整合算法;例如,CiteFuse是為CITE-seq分析而設計的,SCIM是為scRNA和CyTOF整合而設計的,而scMVP是為配對的scRNA和scATAC數據集整合而開發的。此外,除了這些僅限于特定組學數據類型的工具外,還有一些算法,如LIGER是為一般性整合任務而設計的,不受整合組學類型的限制。

多組學整合工具還可以按Python、R等主要編碼語言以及跨組學翻譯等特殊整合應用程序進行分類。所有多組學整合工具及其類別總結在補充材料中。

2. 單細胞多組學整合工具的基準研究
盡管針對多組學單細胞分析已經發表了大量的整合算法,但仍然很難找到最優解。為了解決這個問題,最近有多項基準研究,試圖從數據用戶的角度對候選整合算法的性能進行全面而客觀的評估。

Luecken等人(2022)對單細胞整合工具進行了基準分析,用于圖譜級數據整合任務,并開發了一個對單細胞整合工具進行客觀、全面和可重復評估的基準流程。該研究包括幾個未配對的多組學單細胞整合工具;然而,該研究只針對來自相同組學的不同數據集的整合任務,如不同scRNA數據集的整合或不同scATAC數據集的整合,而沒有提供評估配對或未配對的scRNA和scATAC數據的跨組學整合。盡管如此,本研究仍然為單細胞圖譜整合評估提供了一個穩定、全面、高度可擴展的基準框架。

最近,為了更好地應對單細胞多組學整合分析的數據稀疏性、技術和生物可變性以及高維度帶來的分析挑戰,NeuraIPS2021組織了關于整合單細胞多組學數據三個主要任務的在線競賽,包括(1)從一種組學預測另一種組學,(2)不同組學之間的細胞匹配,(3)共同學習細胞身份的表征。其中,第二項任務是針對非配對多組學整合工具設計的,第三項任務是針對配對多組學整合工具設計的。此外,競賽還生成了第一個單細胞多組學基準數據集,包括一個CITE-seq數據集,其中包含90000個細胞,用于scRNA和蛋白質整合任務,以及一個10x Multiome數據集,包含70000個細胞,用于scRNA和scATAC整合任務。在三個任務中,GLUE包中的半監督模式匹配函數CLUE(cross-linked universal embedding)算法在第二個組學匹配任務中獲得一等獎并獲得所有類別的冠軍,顯示了在未配對整合工具中交叉組學匹配的最佳性能。然而,由于競賽只評估在線提交者的算法,大多數已發表的單細胞多組學整合工具不在評估范圍內。

為了進一步比較已發表的單細胞多組學整合工具與深度學習框架,Brombacher等人(2022)首先使用深度學習模型回顧了18個最近發表的多組學整合工具,然后使用來自NeuraIPS2021的CITE-seq數據集和10x Multiome數據集對選定的工具進行了第一次全面的基準研究。在生物特征保存任務中,Cobolt算法在CITE-seq和10x Multiome數據集上的性能都是基準算法中最好的。只有當細胞數較大時,scMVP在10x Multiome數據集上的性能優于Cobolt。技術影響去除任務中,SCALEX在CITE-seq數據集上表現出的最佳性能,而scMVP在10x Multiome數據集上表現出最佳性能。

總結
在本章中,作者總結了多種類型的多組學單細胞測序技術及生物信息學整合算法的最新進展。隨著實驗數據質量和生物信息學算法性能的提升,單細胞多組學技術將在單細胞水平上為不同研究提供更全面的多組學見解。擴大單細胞多組學技術的生物應用,提高單細胞多組學算法的性能,都將加速生物和醫學研究的新發現。這些改進具有重大的潛力,將徹底改變我們對細胞進程的理解和個性化醫療的發展。

參考文獻:
Sun F, Li H, Sun D, et al. Single-cell omics: experimental workflow, data analyses and applications. Sci China Life Sci. 2025;68(1):5-102. doi:10.1007/s11427-023-2561-0

發布者:上海伯豪生物技術有限公司
聯系電話:021-58955370
E-mail:market@shbio.com

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網 電話:021-64166852;13621656896 E-mail:info@bio-equip.com
主站蜘蛛池模板: 国产精品原创av片国产日韩 | 色综合久久综合网 | 成人午夜精品一级毛片欧美 | 精品一区二区久久久久久按摩 | 久久密av | av片在线播放 | 亚洲4438 | 久久99国产精品一区二区 | 国产在线一 | 中文字幕乱码亚洲无线三区 | 波多野结衣好大好紧好爽 | 国产一区精品视频 | 久久精品久久精品国产大片 | 久久久精品视频免费观看 | 亚洲欧美国产另类首页 | 欧美精产国品一二三区 | 国产精品一页 | 91久久久久久久久久 | 在线中文字幕一区二区 | 国产欧美va天堂在线观看视频 | 69综合网| 欧美视频 亚洲视频 | 日韩毛片一区二区三区 | 狠狠干成人网 | 能免费看的av | 国产不卡一区二区三区在线观看 | 熟女无套内射线观56 | av不卡国产 | 少妇被两个黑人3p喷水在线观看 | 国产一级淫片免费 | 99都是精品 | 日韩欧美在线一区二区三区 | 国产日韩一区二区在线观看 | 久久精品国产精品亚洲红杏 | 国产精品亚洲第一区二区三区 | 国产精品毛片无遮挡高清 | 亚洲视频日韩 | 69精品在线观看 | 国产精品婷婷不卡久久久 | 黄色av一区| 午夜欧美一区二区三区在线播放 |