久热久草在线_一一高清视频在线观看_在线观看91av_久草免费在线观看视频_国产精品午夜无码A体验区_国产一级高清

English | 中文版 | 手機版 企業登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術文章 > DNA甲基化研究的測序數據挖掘思路分享

DNA甲基化研究的測序數據挖掘思路分享

瀏覽次數:1082 發布日期:2023-2-24  來源:本站 僅供參考,謝絕轉載,否則責任自負
大家好,這里是專注表觀組學十余年,領跑多組學科研服務的易基因。

總體來說,DNA甲基化一般遵循三個步驟進行數據挖掘。

首先,進行整體全基因組甲基化變化的分析,包括平均甲基化水平變化、甲基化水平分布變化、降維分析、聚類分析、相關性分析等。

其次,進行甲基化差異水平分析,篩選具體差異基因,包括DMC/DMR/DMG鑒定、DMC/DMR在基因組元件上的分布、DMC/DMR的TF結合分析、時序甲基化數據的分析策略、DMG的功能分析等。

最后,將甲基化組學&轉錄組學關聯分析,包括Meta genes整體關聯、DMG-DEG對應關聯、網絡關聯等。

 

一、甲基化圖譜分析
(1)平均甲基化水平的比較
  • 平均甲基化水平能反應樣本整體的甲基化水平。
  • 但是平均水平差異不大并不能說明樣本間甲基化圖譜沒有差異。
胚胎發育
 
果實成熟
 
肌肉發育

(2)CG/CHG/CHH甲基化水平分布
  • 不同物種中,甲基化修飾可能傾向于發生在不同類型的C位點上,該分析有助于反應甲基化發生位點類型的偏好性。
  • 甲基化水平分布的組間比較,能夠更進一步了解組間甲基化水平的變化。
  • 不同基因組元件(CGI相關元件、重復序列元件、基因元件等)的甲基化水平分布規律不同。特別是在不同物種中,基因元件的甲基化水平可能有一定的特點。
  • 比較特定元件甲基化水平的組間差異也能發現潛在的功能差異。
單樣本三類甲基化水平分布
 

組間CpG甲基化水平分布比較

 
CGI相關元件
 
各類重復序列元件
 

基因元件


(3)降維分析
降維分析嘗試找到最能反映數據點真實分布情況的兩個維度,以方便對數據進行直觀把握。一般采用共同覆蓋的5×以上位點進行分析:
  • 主成分分析(PCA)
  • 非度量多維標度法(NMDS)
  • 主坐標分析(PCoA)

PCA可采用統計檢驗分析組間差異的顯著性:
ü  相似性分析(ANOSIM)
ü  置換多元方差分析(ADONIS)

 
NMDS
 
PCoA


(4)聚類分析
  • 聚類分析考慮的是各樣本之間的距離,即不相似性。一般采用共同覆蓋的5×以上位點進行分析。
  • 與降維分析的差別在于,聚類分析更真實地反映樣本的差距,而非僅考慮兩個代表性維度。

(5)相關性分析
  • 相關性分析考慮的是各樣本之間的相似性。一般采用共同覆蓋的5×以上位點進行分析。
  • 一般采用皮爾森相關系數
 
二、差異甲基化位點/區域分析DMC/DMR分析)
(1)DMC/DMR鑒定
  • 差異甲基化位點:DMC
  • 差異甲基化區域:DMR
(甲基化位點一般是與附近的位點一起起作用的)
ü  鑒定實驗組與對照組甲基化圖譜的具體差異。
ü  如果實驗設計包括多個時間節點,也可以比較相鄰時間節點/感興趣的時間節點之間的甲基化圖譜的差異。
DMC在基因組上的分布
 
DMR在基因組上的分布

(2)DMC/DMR轉錄因子結合分析(TF binding motif )
主要關注Promoter和Enhancer等調控區域DMC/DMR的TF結合位點。

 
3)時序甲基化數據的分析策略(Time Course)
比較相鄰時間點的差異
直接篩選時間階段相關的DMC和DMR
ü  線性模型/混合線性模型
  (可以排除混雜因素干擾,如性別)
共甲基化模式分析(階段特異性Cluster篩選)
ü  WGCNA(權重基因共表達網絡分析)
ü  MEGENA(多尺度嵌入式基因共表達網絡分析)
ü  mfuzz
ü  ... ...

 

(4)DMC/DMR在基因元件上的分布
  • TE(轉座元件):影響基因組穩定性        
  • Promoter:影響基因表達
  • Genebody

(5)差異甲基化基因集(DMGs)的功能分析
分析策略:
  • 可以分為Hyper-DMG和Hypo-DMG
  • 可以分為Promoter-DMG和Genebody-DMG
  • Gene Ontology
  • KEGG pathway
  • Reactome pathway
  • DisGeNET disease
  • Disease Ontology

三、組學關聯分析:甲基化組學&轉錄組學
(1)Meta genes整體關聯
  • 同一樣本/組別內,所有基因的表達水平與對應基因的甲基化水平進行關聯。
  • 研究的是基因甲基化與表達的整體關系。
TSS位點附近負相關
Genebody區正相關
整體負相關

(2)DMG-DEG對應關聯
  • 重疊分析:
特點:簡單粗暴,也適用于樣本量少的情況。
分析結果:韋恩圖。
  • 皮爾森/斯皮爾曼相關性分析
特點:準確計算相關性程度(R值),及其顯著性(p值)。
分析結果:散點圖(+擬合線);相關性熱圖

 

(3)網絡關聯
基于基因表達具有功能和通路的富集性。有最低樣本數量要求。
  • 共表達-共甲基化網絡關聯:
ü  WGCNA module correlation
ü  EMDN algorithm
  • 融合網絡關聯:
ü  SNF algorithm
以上就是關于DNA甲基化測序的數據挖掘思路分享。
發布者:深圳市易基因科技有限公司
聯系電話:0755-28317900
E-mail:wuhuanhuan@e-gene.cn

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網 電話:021-64166852;13621656896 E-mail:info@bio-equip.com
主站蜘蛛池模板: 国产精品国三级国产av | 九一自拍中文字幕 | 色综合久久久久综合体 | 亚洲精品一区二区三区四区乱码 | 国产中文字幕一区 | 久久一区二区精品视频 | 国产精品永久免费嫩草研究院 | 国产精品欧美久久久久一区二区 | 一区二区欧美在线观看 | 国产成人亚洲精品无码车A 男女啪啪高潮无遮挡免费 一本大道香蕉大在线中文 黄色av网址在线观看 | 波多野结衣高清无码视频 | 国产精品综合久久第一页 | 欧洲a级片| 男人天堂导航 | 高清日本欧美久久 | 精品99免费 | 一级毛片在线播放 | 国产猛男猛女超爽免费视频 | 91九色精品 | 99日韩免费看国产成人 | 国产精品久久久不卡 | 国产在线播精品第三 | 少妇高潮流白浆在线观看 | 亚洲欧美观看 | 亚洲国产成人久久一区www妖精 | 成人欧美一区二区三区黑人牛 | 精品十八禁免费观看 | 久久网免费视频 | 一二三四社区在线视频观看 | 色婷婷a v| 91成人国产 | 久久久久久久久国产一区 | 人人草人人搞 | 久久吊 | jizzjizz无码中国在线观看 | 国产欧美亚洲精品a第一页 亚洲欧美另类综合偷拍 | 欧美久久亚洲 | 久久久亚洲一区 | av爱爱com | 香蕉免费一区二区三区在 | 在线观看av中文 |