【基因測序是什么】基因測序有什么用 基因測序原理技術(shù)
隨著基因測序技術(shù)的發(fā)展和費用的降低,現(xiàn)在普通人也可以在可承受的經(jīng)濟范圍內(nèi)進行個體測序分析,測序技術(shù)成為精準醫(yī)學(xué)發(fā)展和個體化治療中一個非常重要的工具,我們即將迎來一個全民測序的時代。而這樣一種強大的工具在科學(xué)家們的手中又可以發(fā)揮出更大價值,挖掘出更有深度的信息?;驕y序技術(shù)在精準醫(yī)學(xué)中得到了哪些應(yīng)用呢?小編從以下幾個方面結(jié)合已發(fā)表文章進行了總結(jié)。
基因測序助力癌癥研究尋找治療靶點
在2016年4月8日那期Science期刊上,美國布羅德研究所Aviv Regev的領(lǐng)導(dǎo)的癌癥研究團隊通過與麻省理工學(xué)院副教授、單細胞分析先鋒Alex Shalek合作,利用單細胞RNA-seq方法每次一個細胞地研究整個腫瘤以便確定哪些類型的細胞存在于腫瘤中。他們不僅分析了惡性腫瘤細胞,而且也分析了腫瘤內(nèi)所有不同類型的細胞。這是首次開展這樣的研究。如今,他們知道每種腫瘤的細胞組成,也知道每種類型的細胞的基因表達模式,這樣就能夠回個頭去重新分析一些大體積腫瘤測序數(shù)據(jù)(比如,癌癥基因組圖譜)以便從現(xiàn)存的數(shù)據(jù)中找出細胞如何相互作用和一定程度上利用細胞重建大塊腫瘤樣品的整體行為。
在一篇發(fā)表在國際學(xué)術(shù)期刊Nature Communication上的文章中,來自美國的科學(xué)家們對109名胰腺導(dǎo)管腺癌(PDA)病人進行了全外顯子測序,發(fā)現(xiàn)了PDA中的基因突變多樣性,并且為發(fā)現(xiàn)PDA治療靶點提供了重要信息。
在該項研究中,研究人員為方便檢測基因突變,同時移除非腫瘤性組織的污染,他們利用顯微切割的方法將癌癥患者的腫瘤組織進行了異種移植并建立了細胞系。隨后對109例進行過顯微切割的PDA病例進行了全外顯子測序,經(jīng)過顯微切割操作后,腫瘤細胞得到富集并增強了對基因突變的檢測。研究人員通過分析發(fā)現(xiàn)導(dǎo)致PDA發(fā)生的病因事件與腫瘤突變譜具有明顯相關(guān)性。
基因測序幫助尋找生物標記物 助力疾病診斷
在歐洲泌尿外科協(xié)會的研究者公布的一項最新研究成果中,研究者對64份前列腺組織樣本進行研究,對每一種樣本中的2億個序列進行閱讀分析,結(jié)果研究者發(fā)現(xiàn)在腫瘤和控制樣本中有超過2000個基因都表現(xiàn)出了明顯的差異性,其中有些相比已知的前列腺癌標志物而言表現(xiàn)出了較高的特異性和敏感性;其中一種名為TAPIR的非編碼RNAs則可以有效抑制癌細胞的生長,盡管其可以轉(zhuǎn)化為臨床有用的治療靶點還為時尚早。
研究者在前列腺癌患者的尿液中發(fā)現(xiàn)了這些生物標志物,檢測結(jié)果顯示其可以幫助進行準確的前列腺癌檢測,基于相關(guān)研究結(jié)果,研究人員決定開發(fā)一種進行前列腺癌早期診斷的高特異性及敏感性的,且基于尿液的檢測手段;這種檢測方法基于對多個生物標志物的組合,相比單一標志物而言將表現(xiàn)出較高的特異性。
基因測序幫助監(jiān)測全球性疾病暴發(fā)
在一篇發(fā)表于Nature雜志上的報道中,來自伯明翰大學(xué)的研究人員解釋了如何利用基因組測序的技術(shù)來快速實現(xiàn)對疾病暴發(fā)的有效監(jiān)測;文章中他們開發(fā)了一種手提箱式的基因組測序“實驗室”,其中包含有一種新型的DNA測序儀,最初該設(shè)備用于2015年4月在幾內(nèi)亞對埃博拉病人的樣本進行檢測。
這項研究中,研究人員利用這種便攜式的DNA測序儀在整個基因組庫中鑒別出了新型的單核苷酸多態(tài)性(SNPs),目前當測序工作局限于實驗室的時候,這種便攜式機器的開發(fā)對于有效進行疾病暴發(fā)的監(jiān)測而言非常重要,研究者們還希望可以將這種便攜式的機器應(yīng)用于別的領(lǐng)域的研究中,比如癌癥研究等。
在另外一項研究中,來自英國牛津大學(xué)和巴西Evandro Chagas研究所等機構(gòu)的研究人員對巴西的寨卡病毒暴發(fā)進行首個基因組分析,從而提供關(guān)于這種病毒如何和何時可能進入美洲方面的新信息。
研究人員對7株巴西寨卡病毒毒株的基因組進行測序,包括一株毒株來自一例致命的成年人病例和另一株毒株來自一名頭小畸型新生兒。
1、第一代測序
1.1 Sanger 測序
采用的是直接測序法。1977年,F(xiàn)rederick Sanger 等發(fā)明了雙脫氧鏈末端終止法,這一技術(shù)隨后成為最為常用的基因測序技術(shù)。2001 年,Allan Maxam 和 Walter Gibert 發(fā) 明了 Sanger 測序法,并在此后的 10 年里成為基因檢測的金標準。其基本原理即雙脫氧核苷三磷酸(dideoxyribonucleoside triphosphate,ddNTP)缺乏PCR 延伸所需的 3'-OH,因此每當 DNA 鏈加入分子 ddNTP,延伸便終止。每一次 DNA 測序是由 4個獨立的反應(yīng)組成,將模板、引物和 4 種含有不同的放射性同位素標記的核苷酸的 ddNTP 分別與DNA 聚合酶混合形成長短不一的片段,大量起始點相同、終止點不同的 DNA 片段存在于反應(yīng)體系中,具有單個堿基差別的 DNA 序列可以被聚丙烯酰胺變性凝膠電泳分離出來,得到放射性同位素自顯影條帶。依據(jù)電泳條帶讀取 DNA 雙鏈的堿基序列。
人類基因組的測序正是基于該技術(shù)完成的。Sanger 測序這種直接測序方法具有高度的準確性和簡單、快捷等特點。目前,依然對于一些臨床上小樣本遺傳疾病基因的鑒定具有很高的實用價值。例如,臨床上采用 Sanger 直接測序 FGFR 2 基因證實單基因 Apert 綜合征和直接測序 TCOF1 基因可以檢出多達 90% 的與 Treacher Collins 綜合征相關(guān)的突變。值得注意的是,Sanger 測序是針對已知致病基因的突變位點設(shè)計引物,進行 PCR 直接擴增測序。單個突變點的擴增包括該位點在內(nèi)的外顯子片段即可,不必將該點所在基因的全部外顯子都擴增。
因此,應(yīng)明確定位要擴增的位點所在的基因外顯子和該點的具體位置,設(shè)計包括該點在內(nèi)的上下游 150 ~ 200 bp 的外顯子片段引物。此外,盡管有NGS 的出現(xiàn),但 Sanger 測序?qū)τ谟兄虏』蛭稽c明確并且數(shù)量有限的單基因遺傳疾病的致病基因的檢測是非常經(jīng)濟和高效的。到目前為止,Sanger 測序仍然是作為基因檢測的金標準,也是 NGS 基因檢測后進行家系內(nèi)和正常對照組驗證的主要手段。
值得注意的是,Sanger 測序目的是尋找與疾病有關(guān)的特定的基因突變。對于沒有明確候選基因或候選基因數(shù)量較多的大樣本病例篩查是難以完成的,此類測序研究還要依靠具有高通量測序能力的 NGS。雖然 Sanger 測序具有高度的分析準確性,但其準確性還取決于測序儀器以及測序條件的設(shè)定。另外,Sanger 測序不能檢測出大片段缺失或拷貝數(shù)變異等基因突變的類型,因此對于一些與此相關(guān)的遺傳性疾病還不能做出基因?qū)W診斷。
1.2 連鎖分析
采用的是間接測序法。在 NGS 出現(xiàn)之前,國際通用的疾病基因定位克隆策略是建立在大規(guī)模全基因掃描和連鎖分析基礎(chǔ)上的位置候選基因克隆。人類的染色體成對出現(xiàn),一條來自父親,一條來自母親,每一對染色體在同樣的位置上擁有相同的基因,但是其序列并不完全相同,被稱為父系和母系等位基因。遺傳標記是指在人群中表現(xiàn)出多態(tài)現(xiàn)象的 DNA 序列,可追蹤染色體、染色體某一節(jié)段或某個基因座在家系中傳遞的任何一種遺傳特性。它存在于每一個人,但大小和序列有差別,具有可遺傳性和可識別性。目前采用第二代遺傳標記,即重復(fù)序列多態(tài)性,特別是短串聯(lián)重復(fù)序列,又稱微衛(wèi)星標記。連鎖分析是以連鎖這種遺傳現(xiàn)象為基礎(chǔ),研究致病基因與遺傳性標記之間關(guān)系的方法。如果控制某一表型性狀的基因附近存在遺傳標記,那么利用某個遺傳標記與某個擬定位的基因之間是否存在連鎖關(guān)系,以及連鎖的緊密程度就能將該基因定位到染色體某一位置上。1986 年 Morton 等提出優(yōu)勢對數(shù)記分法(og odds score method,LOD),主要檢測兩基因以某一重組率連鎖時的似然性。LOD 值為正,支持連鎖;LOD 值為負,則否定連鎖。通過計算家系中的微衛(wèi)星標記與致病位點之間的 LOD 值,可以初步估算二者間的遺傳距離及連鎖程度,從而確定該基因在染色體上的粗略位置。然后利用該區(qū)域的染色體基因圖譜,分析定位區(qū)域內(nèi)所有基因的功能與表達,選擇合適的候選基因進行突變檢測,最終將致病基因定位或克隆。
然而,采用連鎖分析進行基因檢測存在很大的局限性。不但所需遺傳樣本量較大,一般要求提供三代及以上遺傳家系患者血樣,而且數(shù)據(jù)量大、處理復(fù)雜、產(chǎn)出速度較慢、定位不夠精確(一般只能定位在染色體某一區(qū)間),這就使得研究工作繁重和定位基因的時間周期特別長。目前,連鎖分析采用的單核苷酸多肽性和短串聯(lián)重復(fù)序列還在使用,但經(jīng)典的間接測序方法,如單鏈構(gòu)象多肽性、變性梯度凝膠電泳和異源雙鏈分析在美國已被淘汰,而在發(fā)展中國家作為研究手段還在有限使用。
2、新一代測序(NGS)
主 要 包 括 全 基 因 組 重 測 序(whole-genomesequencing,WGS)、全外顯子組測序(whole-exomesequencing,WES)和目標區(qū)域測序(Targeted regionssequencing,TRS),它們同屬于新一代測序技術(shù)??傮w而言,NGS 技術(shù)具有通量大、時間短、精確度高和信息量豐富等優(yōu)點,使得遺傳學(xué)者可以在短時間內(nèi)對感興趣的基因進行精確定位。但這些不同的測序技術(shù)在測序范圍、數(shù)據(jù)分析量以及測序費用和時間等方面又有很大差別,如果選擇適合的方法,對于臨床診斷和科學(xué)研究將起到事半功倍的作用。
2.1 目標區(qū)域測序
目前常用的是基因芯片技術(shù)。其測序原理是基于 DNA 雜交原理,利用目標基因組區(qū)域定制的探針與基因組 DNA 進行芯片雜交或溶液雜交,將目標基因區(qū)域 DNA 富集,再通過NGS 技術(shù)進行測序。其測序過程是通過把數(shù)以萬計的 cDNA 或寡聚核苷酸置于芯片上制成列陣,將芯片上固定好的已知序列的核苷酸探針與溶液中含有熒光標記的相應(yīng)核酸序列進行互補配對,根據(jù)測序儀所顯示強熒光的位置和強度,獲取每組點陣列信息,再利用生物信息學(xué)算法確定目的靶核苷酸的序列組成。測序所選定的目標區(qū)域可以是連續(xù)的 DNA 序列,也可以是分布在同一個染色體不同區(qū)域或不同染色體上的片段。目標區(qū)域測序技術(shù),對于以往通過連鎖分析將基因突變鎖定在染色體某一片段區(qū)域內(nèi),但無法找出突變是一個非常好的進一步檢測手段。2010 年,Nicholas等使用基因分型芯片聯(lián)合連鎖分析技術(shù),成功發(fā)現(xiàn)頭小畸形的新基因 WDR62,文章發(fā)表在《NatGenet》雜志。類似的研究在家族性胰腺癌中確定 8 個候選變異位點和在家族性滲出性玻璃體視網(wǎng)膜病變發(fā)現(xiàn)易感基因 TSPAN12。
基因芯片測序技術(shù)可以將經(jīng)過連鎖分析鎖定了目標范圍或經(jīng)過全基因組篩選的特定基因或區(qū)域進行更深一層的研究,是解決連鎖分析無法發(fā)現(xiàn)致病基因的有效手段?;蛐酒夹g(shù)對于已知基因突變的篩查具有明顯優(yōu)勢,可以快速、全面地檢測出目標基因突變。同時,由于目標區(qū)域受到了限制,測序范圍大幅度減少,測序時間和費用相應(yīng)降低。但基因芯片檢測所需要的 DNA 的量要大,由于已提取的 DNA 存在降解的風(fēng)險,用于基因芯片研究的血標本最好是冰凍的全血,這樣可以使用于檢測 DNA 的量有充分保證。
2.2 全外顯子組測序 (WES)
外顯子組是單個個體的基因組 DNA 上所有蛋白質(zhì)編碼序列的總合。人類外顯子組序列約占人類全部基因組序列的 1%,但大約包含 85% 的致病突變。WES 是利用序列捕獲技術(shù)將全外顯子區(qū)域 DNA 捕捉并富集后進行高通量測序的基因分析方法。采用的技術(shù)平臺主要是羅氏公司的 SeqCap EZ 全外顯子捕獲系統(tǒng),Illumina 公司的 Solexa 技術(shù)和 Agilent 公司的 SureSelect 外顯子靶向序列富集系統(tǒng)。其捕獲的目標區(qū)在 34 ~ 62 M 之間,不僅包括編碼區(qū)同時也加入了部分非編碼區(qū)。NGS 的測序過程主要包括DNA 測序文庫的制備、錨定橋接、PCR 擴增、單堿基延伸測序和數(shù)據(jù)分析。研究者根據(jù)測序儀捕獲到在測序過程中摻入有不同熒光標記堿基片段,經(jīng)計算機將熒光信號轉(zhuǎn)化成不同顏色的測序峰圖和堿基序列?;驕y序結(jié)果與NCBI的SNP數(shù)據(jù)庫、千人基因組數(shù)據(jù)庫等國際權(quán)威數(shù)據(jù)庫比對,最終確定是否為突變基因。
自NGS 技術(shù)問世以來,利用 WES 在臨床疾病致病基因的鑒定研究中取得前所未有的成果。這些成果不僅集中在單基因遺傳疾病,還在多基因影響的復(fù)雜疾病中獲得大量相關(guān)基因的發(fā)現(xiàn)。在單基因遺傳性疾病中,如視網(wǎng)膜色素變性、終端骨發(fā)育不良等發(fā)現(xiàn)新基因或已知基因新突變。在一些罕見的疾病中,如 Kabuki 綜合征、家族性混合型低脂血癥和脊髓小腦共濟失調(diào)癥等疾病中發(fā)現(xiàn)新的致病基因。同時,在小細胞肺癌、慢性淋巴細胞性白血病等腫瘤研究和諸如肥胖癥、腦皮質(zhì)發(fā)育不良等復(fù)雜疾病的研究中也取得豐碩成果。
WES 技術(shù)在篩查范圍和檢出率等方面較其他測序技術(shù)具有明顯的優(yōu)勢。例如,對于采用 Sanger測序和基因芯片測序不能篩查出基因的樣本,可以采用 WES 來進一步基因篩查鑒定。應(yīng)用 WES技術(shù)能夠獲得較傳統(tǒng) Sanger 等方法對編碼區(qū)測序更深的覆蓋度和更準確的數(shù)據(jù)。由于信息量的大幅度增加,WES 可以獲得更多個體的編碼區(qū)信息,因此成為檢測致病基因和易感基因位點的有效手段。與連鎖分析定位方法比較,WES 對家系的要求并不十分嚴格,在單基因遺傳病同一家系中有 2 ~3 個患者和 1 個正常人即可進行致病基因的鑒定研究,而不需要連續(xù)三代的遺傳家系。由于不需要嚴格的三代以上的遺傳家系,WES 使以前不能進行研究的家系成為可能。不僅對于單基因遺傳病是一個很好的研究手段,對于許多常見病,如腫瘤、糖尿病等疾病也可進行大規(guī)模比較研究。
2.3 全基因組重測序 (WGS)
WGS 是對已知基因組序列的物種進行不同個體的全基因組的測序,經(jīng)過數(shù)據(jù)分析后對序列進行拼接、組裝并獲得基因組圖譜,或是對不同組織進行測序并分析體細胞突變的一種研究方法。盡管 WES 可以快速全面地找出個體基因組上的所有突變,從而找到個體間的差異,但對于外顯子以外的區(qū)域則不能有效地進行基因檢測。對于此種情況,目前還要借助WGS 進行全基因組檢測。但由于人類基因組過于龐大,一次單端全基因組測序很難達到所需要的測序深度。因此,需要重復(fù)測序或雙端測序,由此帶來測序成本的大幅度提高和由于不能達到足夠的測序深度所導(dǎo)致的結(jié)果準確性的降低。而對于臨床疾病診斷和普通科研工作,其高昂的檢測費用也是難以承受的。盡管如此,對于部分臨床研究和 WES 不能解決的科研課題還需要借助 WGS進行更加全面的基因檢測。