久热久草在线_一一高清视频在线观看_在线观看91av_久草免费在线观看视频_国产精品午夜无码A体验区_国产一级高清

English | 中文版 | 手機版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術文章 > 第二代高通量測序技術使用的DNA裝配工具

第二代高通量測序技術使用的DNA裝配工具

瀏覽次數(shù):11954 發(fā)布日期:2010-8-16  來源:本站 僅供參考,謝絕轉載,否則責任自負

     第二代高通量測序儀實現(xiàn)了較廉價和快速的DNA測序方法,但是它們有一個共同的缺點即讀出序列(reads)太短,大約在幾十個bp到幾百個bp。與生物的染色體長度相比,這樣長度的reads給下一步的裝配工作帶來麻煩。看似種類繁多的生物界其實只使用4種核苷酸,分別為A,T,G,C。這意味著DNA序列中會有數(shù)量極為龐大的片段存在重復的序列。

     因此裝配過程中有時很難判斷短reads在原序列中的位置,reads A可以放到C,D,E等多個位點上,reads B看似可以放在D,G,H等位點上。這類的工作靠手工無法完成,需要使用計算機按照一定的規(guī)則和要求來裝配reads。
     下面介紹一些非設備生產(chǎn)廠商提供的裝配軟件和特點。
 
1.  軟件名:Cross_match,作者:Phil Green, Brent Ewing and David Gordon
     網(wǎng)址:http://www.phrap.org/phredphrapconsed.html
 
     CROSS_MATCH用于蛋白質和核酸的序列對照,使用Smith-Waterman-Gotoh算法。通過對遞歸關系的改進提高了運行效率。適用于1. 按照參照序列為reads排序。2. 比較由不同的方法得到的重疊群(contig)。3. 比較完成裝配后重疊群和粘粒(cosmid)的序列。
 
2.  軟件名:Exonerate ,作者:Guy S. Slater and Ewan Birney
     網(wǎng)址:http://www.ebi.ac.uk/~guy/exonerate
    
     采用啟發(fā)式漸進算法完成排序運算,避免了遍歷耗時長的缺點,同時也解決了啟發(fā)漸進算法難以執(zhí)行的問題。
 
3.  軟件名:MAQ,作者:Heng Li
     網(wǎng)址:http://maq.sourceforge.net
 
     MAQ依照參照序列對reads快速裝配,推斷出包括SNPs、插入、刪除在內的各種變體。在排序階段,首先按照最低的錯配值(mismatch score)搜索無空隙的排列。為提高速度MAQ只采用在前28bp中最多存在2個錯配的reads。
     MAQ在設計時就考慮處理人類DNA序列的需要,對硬件要求低筆記本電腦就可以輕松運行。為了便于查看結果,MAQ同時提供一個基于OpenGL的瀏覽工具MAQview。
 
4.  軟件名:Mosaik,作者:Michael Strömberg and Gabor Marth
     網(wǎng)址:http://bioinformatics.bc.edu/marthlab/Mosaik
 
     MOSAIK能夠讀取范圍較廣的reads從幾十bp到上百bp,按照Smith-Waterman算法,依據(jù)模板產(chǎn)生有空隙的排列。另外,MOSAIK支持多線程運行,最多可有8個CPU。可以全面支持3大主流測序儀Roche 454, Illumina, AB SOLiD,試驗性地支持Helicos。
 
5.  軟件名:BWA,作者:Li H. and Durbin R
     網(wǎng)址:http://bio-bwa.sourceforge.net/
 
     Burrows-Wheeler Aligner (BWA)允許采用較長的參考序列,而排列相對較短的核苷酸序列。BWA執(zhí)行2種算法BWA-Short和BWA-SW。BWA-Short適用于短于200bp的reads,后者適用于大約100kbp的長度。兩者均能排列出有空隙的序列,雖然BWA-SW也能工作于較短的reads,但是它的敏感度較低,反之亦然。
 
     DNA裝配工具種類繁多,以上介紹了幾種比較典型的。此外還有RMAP,SHRiMP,SOAP,SSAHA2,SXOligoSearch等等,限于文章的篇幅這里就不一一介紹了。
     那么如何選擇一種適合自己需要的軟件呢?涉及到以下幾種因素。
1.  系統(tǒng)運行時間,圖一是幾種軟件對不同長度reads排序的時間消耗。

圖一 By Bala et al

2.  系統(tǒng)硬件的要求,下圖是軟件消耗內存大小的比較。

圖二 (By Bala et al)
 
3.   準確度上的差異,比較結果見下圖。

圖三 (By Bala et al)
 
4.   是否能從事查找SNPs、SV等方面的工作。
5.   Solexa,454,SOLiD測序結果的輸出格式并不相同,注意有所區(qū)別。很少有一款軟件可以支持所有格式的。
 
     reads的裝配還牽涉到另一個至今未妥善解決的問題。我們把基因組的長序列打斷(shortgun method),因為不知道整條基因組序列是如何排列、如何區(qū)分來自不同染色體的reads。同時現(xiàn)有的技術又不允許一次測完整條基因組序列。必須按照一定的算法,使用計算機高速計算的能力把這些短序列組裝起來還原成原來的序列(de novo assembly)。
     因為沒有參照序列,很可能組裝后的序列與原序列大相徑庭。一種稱作為paired-end的序列測序方法給出具有固定間距的reads。如下:
It is a very long human genome, so much longer than E.Coli’s.
It i*****ery *****huma*****ome,*****uch *****r th*****Coli***
     一個聰明的辦法,卻沒解決所有的難題。因為基因組中含有大量的重復序列(repeats),多態(tài)性變異(Polymorphism),測序錯誤(Sequencing error),一條序列存在很多可能的路(圖論),或者回環(huán)等。見下圖。

針對這些問題,已取得較滿意結果的部分軟件如下:
1.    軟件名Edena,作者:David Hernandez et al
       網(wǎng)址:http://www.genomic.ch/edena
 
2.    軟件名SHARCGS,作者:Juliane Dohm et al.
       網(wǎng)址:http://sharcgs.molgen.mpg.de
 
3.    軟件名SSAKE,作者:René Warren et al.
       網(wǎng)址:http://www.bcgsc.ca/platform/bioinfo/software/ssake
 
4.    軟件名VCAKE,作者:William Jeck
       網(wǎng)址:http://sourceforge.net/projects/vcake
 
5.    軟件名Velvet,作者:Daniel Zerbino and Ewan Birney
       網(wǎng)址:http://www.ebi.ac.uk/%7Ezerbino/velvet
 
      目前看來能最終解決組裝問題的希望寄托在第三代高通量單分子測序技術的問世上,提高每個reads的長度才是王道。在生命探索的征途上,科學家們任重而道遠。

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com
主站蜘蛛池模板: 色噜噜狠狠狠狠色综合久一 | 亚洲aⅴ无码专区在线观看 亚洲欧美小视频 | 97超碰成人 | 日本美女一区二区三区插比 | 日韩精品99久久久久久 | 成人免费视频视频在线观看 免费 | 99精品众筹模特自拍视频 | 成人av在线播放 | 最近高清无吗免费看 | 欧美成人国产 | 欧美一区二区精品国产激情爱 | 久久精品亚洲一区二区三区观看模式 | 日韩一级在线免费观看 | 日韩不卡一区二区三区 | 国产一级毛片网站 | 精品国产综合 | 97精品国产| 99亚洲精品 | 天天躁人人躁人人躁狂躁 | 国产精品一色哟哟 | 欧美3p两根一起进高清免费视频 | 精品久久久久久久久久久aⅴ | 亚洲精品免费av | 黑人40cm性做爰免费视频 | aaaa大片| 亚洲无人区一区二区三区 | 成人精品后入三区丝袜激情一区二区 | 国产视频中文字幕在线观看 | 国产精品久久久久久久久小说 | 中日韩黄色大片 | 偷拍激情视频一区二区三区 | 麻豆va一区二区三区久久浪 | 国产二区在线看 | 91视频免费网站 | 国产黄色A一片免费看 | 不卡的av一区二区 | 成人久久18免费网站麻豆 | 一区二区不卡在线 | 国产亚洲视频网站 | 成人aaaa免费全部观看 | 亚洲欧美日韩精品久久久 |