人類基因組計劃、基因芯片、個性化分子診斷、生物云計算……這些在21世紀第一個十年里吸引無數眼球的熱門詞匯,都和一個產業頗有淵源——DNA測序。生物技術和信息技術在這片創意新天地里水乳交融,如果用一句詩來形容坐擁兩大技術護航的DNA測序產業,那就是——天生麗質難自棄。
隨著人類基因組計劃的完成,人類對自身遺傳信息的了解和掌握有了前所未有的進步。與此同時,分子水平的基因檢測技術平臺不斷發展和完善,使得基因檢測技術得到了迅猛發展,基因檢測效率不斷提高。從最初第一代以 Sanger 測序為代表的直接檢測技術和以連鎖分析為代表的間接測序技術,到 2005 年,以 Illumina 公司的 Solexa技術和 ABI 公司的 SOLiD 技術為標志的新一代測 序 (next-generation sequencing,NGS) 的 相 繼 出現,測序效率明顯提升,時間明顯縮短,費用明顯降低,基因檢測手段有了革命性的變化。
DNA測序技術經歷了不同的發展階段,本文將重點介紹第一代、第二代、第三代測序的基本原理、代表性的測序平臺以及不同發展階段的測序技術的特點。
第一代測序技術
傳統的雙脫氧鏈終止法、化學降解法以及在它們的基礎上發展來的各種DNA測序技術統稱為第一代DNA測序技術。人類基因組計劃(human genome project,HGP)主要基于第一代DNA測序技術。
雙脫氧鏈終止法
雙脫氧鏈終止法又稱為Sanger法。該方法的原理是:核酸模板在DNA聚合酶、引物、4種單脫氧核苷三磷酸(dNTP,其中的一種用放射性P32標記)存在條件下復制時,在四管反應系統中分別按比例引入4種雙脫氧核苷三磷酸(ddNTP),因為雙脫氧核苷沒有3’OH,所以只要雙脫氧核苷摻入鏈的末端,該鏈就停止延長,若鏈端摻入單脫氧核苷,鏈就可以繼續延長。如此每管反應體系中便合成以各自的雙脫氧堿基為3’端的一系列長度不等的核酸片段。反應終止后,分4個泳道進行凝膠電泳,分離長短不一的核酸片段,長度相鄰的片段相差一個堿基。經過放射自顯影后,根據片段3’端的雙脫氧核苷酸,便可依次閱讀合成片段的堿基排列順序。
第一代測序技術的主要特點是:
第二代測序技術(NGS)
隨著人類基因組計劃的完成,人們進入了后基因組時代,即功能基因組時代,傳統的測序方法已經不能滿足深度測序和重復測序等大規模基因組測序的需求,這促使了新一代DNA測序技術的誕生。新一代測序技術也稱為第二代測序技術,主要包括羅氏454公司的GS FLX測序平臺、Illumina公司的Solexa Genome Analyzer測序平臺和ABI公司的SOLID測序平臺。
第二代測序技術核心思想是邊合成邊測序(Sequencing by Synthesis),即通過捕捉新合成的末端的標記來確定DNA的序列。以Illumina的技術原理為例做一下說明:先在片段DNA兩端臉上接頭,目的是能夠匹配到芯片上的接頭,接著與芯片雜交,進行橋式擴增,接著簇的形成,是為了保證信號強度,再加入四種有阻滯劑和熒光標記的單核苷酸,如此循環,記錄每個循環的熒光信息,最后得到序列信息。
第二代測序技術最顯著的特征是高通量,一次能對幾十萬到幾百萬條DNA分子進行序列測序,使得對一個物種的轉錄組測序或基因組深度測序變得方便易行,同時成本也大大下降。
Illumina測序流程
第三代測序技術
近年來,測序技術取得了新的進展,發展到第三代測序。第三代測序技術的核心理念是以單分子為目標的邊合成邊測序。該技術不需要經過PCR擴增,實現了對每一條DNA分子的單獨測序。代表性的測序平臺有PacBio公司的SMRT和Oxford Nanopore Technologies納米孔單分子測序技術。
其中PacBio SMRT技術其實也應用了邊合成邊測序的思想,并以SMRT芯片為測序載體。基本原理是: DNA聚合酶和模板結合,4色熒光標記 4 種堿基(即是dNTP),在堿基配對階段,不同堿基的加入,會發出不同光,根據光的波長與峰值可判斷進入的堿基類型。同時這個 DNA 聚合酶是實現超長讀長的關鍵之一。SMRT技術的測序速度很快,每秒約10個dNTP。
三代測序設備在DNA 序列片段讀長上優于二代設備,但在準確度上較二代設備差,未來隨著技術的改善,三代測序設備將更為穩定和成熟。
PacBio SMRT測序原理
DNA測序技術經過30多年的發展,目前已經到了第三代,三代測序技術有各自的優勢。未來,基于不同的測序的目的,三代測序技術的應用將各自發揮功效,同時測序成本也將進一步下降,測序技術的快速發展也將促進生物研究和醫療應用的進步。