2. 單個細胞系的轉錄組異質性
根據轉錄組異質性的模式。在UMAP中,42個細胞系大致可以分為離散型和連續型兩種類型(圖2a)。由于這些細胞系中存在亞克隆,不同的亞簇在空間上被觀察到是離散的,而連續的亞簇在亞簇之間沒有明確的邊界。總共有25個細胞系(57%)和17個細胞系(43%)分別屬于離散組和連續組(圖2b)。總體而言,離散/連續分類與多樣性得分相關性較好,其中多樣性得分最高的前25%的細胞系大多數是離散模式(圖2b),并且離散組的多樣性評分明顯高于連續組,這表明具有高度異質性的細胞系通常派生出不同的亞類。然而,也有一些離散細胞系的多樣性評分較低,如SW620,而連續模式細胞系的多樣性評分較高,如SK-BR-3(圖2b)。對于前者,簇內距離明顯小于簇間距離。因此,盡管在集體距離不是很大的情況下,該細胞系的多樣性得分較低,但根據分類,該細胞系呈現出離散的模式。對于后者,集體距離可以很大,而簇內距離與簇間距離沒有顯著差異。綜上所述,兩個指標顯示的細胞系內異質性表明,轉錄組多樣性可能受到不同亞克隆的存在以及細胞系內在可塑性的影響,這兩個因素對細胞系內異質性的貢獻在單個細胞系中有所不同。
3. 轉錄組異質性形成的分子特征
接下來,將相似的NMF合并到NMF集群中,以確定40個癌細胞系中的復發性NMF程序。在3個以上的細胞系中鑒定出了12個異質性激活的簇(圖2c)。隨后,基于同一簇內單個程序之間的共有基因,其中出現在超過25%的程序中的基因被用作標志基因。大多數細胞系共有的兩個最突出的簇與細胞周期有關,包括G1/S和G2/M程序(圖2c、d),這表明細胞周期變化是大多數細胞系中觀察到的轉錄組異質性的主要原因。除了細胞周期相關的程序外,另外10個簇代表了各種關鍵的生物過程(圖2d)。
4. 人細胞系的泛癌scATAC-seq
進一步使用scATAC-seq在單細胞分辨率下研究單個細胞系內的表觀基因組異質性。為了提高通量和降低scATACseq實驗的成本,每次運行scATACseq時,最多合并6個具有不同表達譜的細胞系,然后根據差異表達基因的可及性特征計算分配給相應的細胞系(圖3a)。經過質量過濾,獲得54,597個高質量的單核,每個細胞系的中位數為1170個核(范圍從203到4391個核),每個細胞核的中位數片段為11,702個。然后,我們匯總scATAC-seq譜來計算開放染色質區域的基因組分布,結果顯示35.5%的ATAC峰定位在啟動子-近端區域(<±1.5 kb TSS)。使用UMAP將39個細胞系一起繪制,以呈現染色質水平上的細胞系間距離,每個細胞系形成一個不同的簇(圖3b)。為了在表觀基因組水平上評估細胞系內的異質性,我們將細胞劃分為細胞系內的初步集群。結果,62%的細胞系表現為無差別模式,38%的細胞系表現為差異模式(圖3c)。總體而言,不加區分差異分類與多樣性評分相關性良好,屬于差異組的細胞系的多樣性評分明顯高于不加區分組的細胞系(圖3d、e),這表明具有高度異質性的細胞系通常派生出不同的亞簇。
5. 與CNVs相關的轉錄組異質性
為明確觀察到轉錄異質性的起源,我們首先轉向惡性腫瘤常見的遺傳變異。使用scRNA-seq數據分析大規模拷貝數變異(CNV),計算了與正常細胞相比,每個位點周圍400個基因平均表達水平。該分析在40個(62.5%)癌細胞系中鑒定出25個CNV亞克隆(圖4a、b),表明CNV誘導的拷貝數變異在很大程度上有助于轉錄變異;17個(42.5%)細胞系未顯示相關性(圖4b)。在這25個細胞系中,分別有18個和7個細胞系表現為離散型和連續型,其余15個細胞系中分別有6個和9個細胞系表現為離散型和連續型。這表明,當遺傳變異導致細胞系內部異質性時,細胞系傾向于以更離散的方式呈現異質性轉錄組活性。然后,研究了位于CNV區域的基因是否有助于這些匹配細胞系的轉錄組變異性。結果顯示,差異表達的基因確實在CNV區域顯著富集(圖4c),表明遺傳變異是決定離散型細胞系細胞系內異質性的重要因素。這一事實也表明,即使對于那些具有不同模式的細胞系,也存在其他因素影響轉錄組異質性。
6. 染色質可及性調控轉錄組異質性
為了探索表觀基因組異質性的機制,我們采用了包括ArchR28和ChromVAR30在內的兩種方法,試圖推斷驅動細胞亞簇之間差異染色質可及性的潛在轉錄因子,并重點研究了至少三種細胞系中出現的常見TF(圖5a)。參與調節IFN應答的IRF1、IRF2、IRF9和STAT2,在LS 174T和hnscum - 02t細胞系中被異質激活。然后,我們將重點放在分別在scRNA-seq和scATAC-seq數據中表現出離散和差異模式的7個細胞系上,試圖在兩個數據集之間匹配子簇。根據scATAC-seq數據計算基因評分矩陣,然后根據基因評分與基因表達的相似性進行比對。結果,在7個細胞系中的3個,包括MDA-MB-231、RPMI 8226和SNB75,細胞亞簇可以在兩個數據集之間自如匹配(圖5b、c、d)。根據scATAC-seq和scRNA-seq數據,MDA-MB-231細胞分別聚為4個和3個亞組,其中scATAC-seq數據集的亞組2與scRNA-seq數據集的亞組1和2的混合匹配。對于SNB75,,scATAC-seq數據的3亞組與scRNA-seq數據的0和1亞組的混合匹配,其余scATAC-seq數據的亞組與scRNA-seq亞組呈一對一的相關性(圖5b、c、d)。這表明染色質可及性和CNV的異質性可以獨立促成轉錄組異質性,對于這三種細胞系,染色質可及性對轉錄組異質性有很大貢獻。
為了進一步探索驅動異質染色質可及性和RNA表達的分子機制,我們試圖推斷結合差異可及性染色質區域的潛在TF。通過測量基因組特征集內染色質可及性的增益或損失來推斷TF活性,同時控制技術偏差,揭示潛在的TF在亞群之間表現出可變性(圖5e)。在MDA-MB-231中,發現FOXA2的活性在0亞組中特異性上調(圖5f),FOXA2的啟動子可及性在0亞組中也有所增加(圖5g)。我們隨后分析了FOXA2的下游靶標,發現它們與“Kras_signaling_up”相關的基因更多相關(圖5h),這些基因在0亞組中表達上調(圖5i)。FOXA2可以在腫瘤發育過程中協同KrasG12D的激活。我們的結果表明FOXA2可能在控制異質性中起重要作用。
圖 5
7. ecDNA分布誘導的轉錄組異質性
最近的研究表明,癌基因擴增既存在于染色體上,也存在于染色體外環狀dna (ecDNAs)上。由于在ecDNA中沒有著絲粒,與染色體擴增子相比,它們不太穩定,并且隨機地分離到子細胞,這可能是細胞異質性的潛在驅動力。為了研究ecDNA對轉錄組異質性的貢獻,我們首先建立了一種分析方法,該方法能夠利用scATAC-seq數據檢測高潛力的ecDNA區域,基于以下假設:(1)ecDNA高度擴增;(2) ecDNA具有更高的可及性。根據scATAC-seq數據,在每個單細胞中讀取覆蓋率呈現多個峰,其中第一個峰被認為是兩個拷貝基因組區域的讀取覆蓋率,因此在這里定義為參考覆蓋率。為了尋找潛在的ecDNA片段,我們首先將整個基因組分成100,000 bp的bin,在歸一化測序深度后量化每個細胞中每個bin的讀取覆蓋率。然后,我們計算相對讀取覆蓋率,作為每個bin的覆蓋率與單元的參考覆蓋率的比率。由于ecDNA具有更高的可及性,相對覆蓋率至少為6的區域被定義為潛在的ecDNA片段,并通過TSS富集評分和細胞數量進一步過濾。此外,考慮到scATAC-seq數據的稀疏性,如果由于實驗和作圖偏差,該區域沒有被scATAC-seq讀取均勻和充分覆蓋,即使來自連續基因組區域的ecDNA也可以基于scATAC-seq數據檢測到多個ecDNA片段。因此,我們已經鑒定的ecDNA片段的數量應該高于在細胞中發現的不同ecDNA物種的數量。
為了解決這個問題,研究了它們在單個細胞系中不同潛在ecDNA片段之間的讀取覆蓋率的相關性,并將附近和高度相關的片段合并為潛在的ecDNA區域。然后,我們將合并的區域定義為潛在的ecDNA區域。如圖6a所示,在31個細胞系中,每個細胞系中檢測到229個潛在的ecDNA區域。我們的方法成功地發現了實驗證實的ecDNA,如K562中的chr9:130700000-131400000,其中ABL1和NUP214位于11中。致癌基因在潛在的ecDNA區域顯著富集(圖6a)。與沒有致癌基因的ecDNA相比,在單個細胞系中,含有致癌基因的ecDNA出現在更高比例的細胞中(圖6b),這表明含有致癌基因的ecDNA為細胞提供了生長優勢,因此具有異質性。考慮到ecDNA可以通過增加DNA拷貝數來增加轉錄RNA的數量,我們進一步計算了ecDNA上的基因表達與ecDNA在每個細胞中的相對覆蓋數之間的相關性,發現它們是部分相關的(圖6c)。例如,位于SCC-4細胞系不同ecDNA中的基因KRT14和KRT17、LGALS2、SERPINE1和PCOLCE在SCC-4細胞系中以不同的三個亞簇特異性表達(圖6d)。鑒定這些基因高表達的細胞比例與含有這些基因的ecDNA的細胞比例高度相關(圖6e)。這一結果表明,ecDNA的高拷貝數有助于ecDNA中基因的高表達。為了進一步評估ecDNA對轉錄異質性的影響,我們選擇了MDA-MB231,其scATAC-seq和scRNA-seq數據可以整合(圖5b-d),以反映scRNA-seq數據分析的UMAP中ecDNA的拷貝數。如圖6f所示,Chr12: 5900000_7200000 ecDNA在亞簇0中特別富集。同時,位于該ecDNA上的CD9、LTBR、PTMS、TPI1、ENO2、C12orf57等基因在亞簇0中也有高表達(圖6g), CD9是亞簇0的頂級標記基因之一。這些結果表明,ecDNAs可以影響基因表達,從而影響細胞聚集。
8. 低氧處理重塑細胞系內異質性
腫瘤的發生和發展是一個動態的過程,伴隨著微環境的劇烈變化。微環境在腫瘤進展、治療抵抗和轉移形成中發揮重要作用,并增加了另一層調控,可驅動腫瘤內異質性。在這里,我們試圖評估這些轉錄組異質性在不同條件下是靜態的還是可塑性的。鑒于在實體瘤中,腫瘤細胞經常處于不同程度的缺氧狀態,我們選擇缺氧處理作為環境應激進行擾動,結果顯示,缺氧處理后,低氧相關基因發生了顯著變化。為了匹配缺氧治療前后的細胞亞群,我們觀察到兩種類型的相關模式:(1)細胞簇在缺氧處理前后是一對一匹配的,這表明缺氧處理沒有改變細胞簇之間的差異,如ZR-75-1(圖7a);(2)一些細胞簇從一個分裂到多個,這表明一個細胞簇內的細胞可能對缺氧有不同的反應,如DLD-1和SW620(圖7c、e)。為了確定在一個亞群中引起對缺氧應激差異反應的潛在機制,我們重點研究了在缺氧下分裂的亞群。例如,在缺氧條件下,DLD-1的子簇0分為2個簇(圖7c)。我們檢查了集群0和0-1/0-2之間的差異表達基因(DEGs):集群0和0-1之間變化最大的基因是缺氧相關基因,如BNIP3L、SLC2A1和ERO1A,而集群0和0-2之間的缺氧相關DEGs有限(圖7d)。這表明原簇0中存在兩組細胞對缺氧的反應不同,但在缺氧處理前的轉錄水平差異不明顯。同樣,在SW620細胞中,簇0被分為簇0-1和簇0-2(圖7e);盡管所有細胞都對缺氧有反應,但簇0-1中的細胞顯示了與EMT相關的其他基因的變化(圖7f)。