侵權投訴
訂閱
糾錯
加入自媒體

基因測序是否準確,這篇文章從原理講清楚了!

2021-02-07 09:17
動脈網
關注

3基因突變與疾病的關系

中國民間流傳千百年的俗語非常生動形象地描述了基因的主要特征——遺傳和變異。

“龍生龍,鳳生鳳”是遺傳;“龍生九子,各有不同”是因為基因的變異。遺傳與變異,是生物界不斷地普遍發(fā)生的現象,也是物種形成和生物進化的基礎。人類基因的遺傳與變異,與環(huán)境共同作用,決定了人的生、長、老、病、死,F代醫(yī)學研究證明,所有的疾病,除了外傷、中毒或營養(yǎng)不良以外,幾乎都跟基因有關。

按照基因變異在疾病中發(fā)揮作用的程度可將疾病分為至少四類:1)完全由基因決定的:比如單基因罕見遺傳病中的先天性成骨不全癥、血友病、杜氏肌營養(yǎng)不良等。2)基本上由基因決定,但需要環(huán)境中的一定誘因:比如單基因遺傳病中的苯丙酮尿癥,早期人們只知道它與遺傳有關,現在知道只有吃了含苯丙氨酸量多的食物才誘發(fā)此。3)遺傳因素和環(huán)境因素都有作用,這一類疾病里又分為主要由遺傳因素決定的:如遺傳性腫瘤,精神發(fā)育障礙等;以及遺傳和環(huán)境同樣重要的,如高血壓、冠心病、糖尿病等各種慢病等;4)完全取決于環(huán)境因素:如燒燙傷、感染等。

根據國內外指南和專家共識,目前疾病與基因的關系又可簡單分為5個等級。包括:

致。阂话阒富蛲蛔兣c疾病發(fā)病有這因果關系,都是在多個人群重復出了結果,并有可能開展了細胞動物實驗得出的結果。

例如:因為ATP7B基因突變,所以導致ATP酶功能減弱或消失,引致血清銅藍蛋白(Ceruloplasmin,CP)合成減少以及膽道排銅障礙,蓄積在體內的銅離子在肝、腦、腎、角膜等處沉積,引起肝豆狀核變性(Hepatolenticular degeneration,HLD)。該病由Wilson在1912年首先描述,故又稱為威爾遜病(Wilson Disease, WD)。是一種常染色體隱性遺傳的銅代謝障礙性疾病,以銅代謝障礙引起的肝硬化、基底節(jié)損害為主的腦變性疾病為特點,對肝豆狀核變性發(fā)病機制的認識已深入到分子水平。HLD的世界范圍發(fā)病率為1/30 000~1/100 000,致病基因攜帶者約為1/90。本病在中國較多見。HLD好發(fā)于青少年,男性比女性稍多,如不恰當治療將會致殘甚至死亡。

含有致病突變的人相對于一般人有非常顯著的高發(fā)病可能,純合的致病突變很有可能直接導致疾病發(fā)生,雜合的致病突變有50%的幾率遺傳給后代,并根據遺傳致病情況(顯性遺傳或隱性遺傳)對后代造成不同的疾病表型。具有該類突變的患者應該進行相關疾病的特定檢測,并根據臨床結果制定后續(xù)治療方案;

危險因素:一般指基因突變顯著性的呈現在發(fā)病人群,在不/未發(fā)病人群里,這類基因突變顯著降低。這里的顯著,均值的統計學差異。然而這樣的突變,目前僅通過了不同表型的人群分析出來了統計學差異,并沒有發(fā)現病因學、病理學的差異以及信號通路上必然存在的變化,也沒有相應的體內體外實驗來驗證其因果關系。

例如:β-微精漿蛋白(Microseminoprotein-beta, MSMB)是前列腺上皮細胞分泌的三大蛋白之一。Eeles et al.(2008)對1854名在60歲前診斷為前列腺癌的病人和1894名有低PSA濃度(less than 0.5 ng/ml)的正常人進行了基因組水平的研究,共分析了 541,129個SNPs。最終發(fā)現MSMB基因的此位點突變與前列腺癌顯著相關 (8.7 x 10-29)。致病突變T,會影響眾多與轉錄相關因子的結合。Thomas et al.(2008)對3941名前列腺癌病人和3964名正常人也進行了基因組水平的研究,共分析了26958個SNP,也發(fā)現MSMB基因的此位點突變與前列腺癌顯著相關(7.31 x 10-13)。Chang et al.(2009)對2,899名病人和1722名健康人進行了研究,發(fā)現MSMB基因的此位點與前列腺癌的相關程度最高。Lou et al.(2009)對歐洲的6118名病人和6105名正常人的染色體10進行了研究,也發(fā)現了MSMB基因的此位點與前列腺癌顯著相關程度最高(p = 8.8 x 10-18)。

危險因素級別的突變代表該基因位點與所檢測的疾病相關性比較高,有該基因的突變,是發(fā)病的危險因素,與疾病的高發(fā)相關,具有該類突變的患者應該關注相關的健康管理和醫(yī)療。但由于科研深度有限,該突變不一定是疾病發(fā)生的原因。

不確定:代表該基因位點與所檢測的疾病在不同研究中的結果不一樣,有待更多的研究來進行核實該基因位點的改變與疾病發(fā)生的相關性;

良性:代表該基因位點雖然與一般人相比有改變,但是其改變與檢測疾病無關;

風險未知:代表該基因位點雖然與一般人相比有改變,但目前并沒有研究報道這個位點的改變與該疾病存在相關性。

通過基因測序,我們可以明確知道,一個人的變異位點中,有哪些是致病的突變,哪些是有危險因素的突變,這樣才能根據基因檢測結果對個人和后代是否患病進行準確性的判定。然后通過這些風險的評估,進行相應的個性化健康管理。

4疾病數據庫的準確性與發(fā)展

然而,這些與疾病相關的突變不是憑空而來的,是科學家們日以繼夜的科研累積,才能打開一點點疾病成因的未知世界。所以,我們必須建立一個能夠快速查找上述DNA變異與疾病相關的數據庫,才能在短時間內完成基因突變與疾病相關分析。

一個準確的數據庫,可以讓分析更準確,判斷一個疾病的病因,進行正確的治療。反之,一個不足準確的數據庫,則可導致分析錯誤,甚至因此進行后續(xù)錯誤的治療。在此可以舉一個不足準確的數據庫例子:

image.png

某基因檢測公司的一份報告(左圖),通過rs7997012這個SNP位點的雜合突變,該公司報告客戶有抑郁癥的風險。原因是所引用的這兩篇文章。這兩篇文章一篇發(fā)表于2012年,另一篇發(fā)表于2014年,都是來自一個叫“Journal of Affective Disorders”的雜志,影響因子3.5,且是做的薈萃分析(meta-analysis)。在沒有闡述算法的前提下,我們可以先看該公司給出的檢測基因位點:rs7997012。這個位點如右圖所示(來源于NCBI),臨床結論是治療抑郁癥的藥物有效性,這個位點的突變會改變藥物使用效果,而不是這個基因的突變會導致抑郁癥的發(fā)。∫虼,錯誤的數據庫會導致基因檢測的錯誤結論,哪怕檢測出的基因型是正確的。

如果這個客戶因為根據上述報告后續(xù)進行相關抑郁癥治療,那結果可能都是基于一個錯誤的判斷。那么如何確定一個數據庫是否可靠呢?

目前通用的做法是,整合國際上幾個通用的人類基因組和疾病數據庫,例如人類罕見病數據庫OMIM,人類基因突變數據庫(HGMD),臨床方面疾病相關突變數據庫Clinvar等。同時,還要將最新的權威科研結果,例如發(fā)表在Science, Cell, NEJM, JAMA, Nature等頂級期刊的相關文章進行搜集整理,將這些整合在一起,成為一個公司的核心資產。以珠諾云公司為例,構建和維護疾病數據庫的工作固定人員要超過5人,包括數據庫架構師和管理員,以及對公共數據庫和最新權威文獻進行Review的科學家。工作流程是首先篩選公共數據庫可靠的結果,將公共庫評級等級高的位點整合進公司疾病數據庫,再安排科學家進行Review,核對原文中該位點的生物學和醫(yī)學意義,將有問題或者統計學沒有顯著性差異的位點排除后,把有意義的位點保留。另外,承擔Review工作的科學家還會對最新發(fā)表的文獻進行搜集和整理,將這些新文章中有意義的位點納入公司疾病數據庫。最后讓數據庫構架工程師對這些信息位點進行整理,形成可比對、可查詢的疾病相關基因數據庫。

這是每個基因檢測公司的核心資產,也不太容易通過第三方進行合理評估。

最后,基因檢測機構自有或國際公共疾病與基因突變數據庫并不是一成不變的。從上世紀80年代PCR技術發(fā)明以后,人們逐步開始了解了基因突變和疾病的關系。如第3部分所述,一般來說,越嚴重的疾病越容易被更早的發(fā)現和基因突變的關系,如β地中海貧血;越溫和的慢病,越不容易找到相關基因,必須做大人群樣本的GWAS研究才能逐步了解基因和疾病的關系,如高血壓、糖尿病等。

image.png

人類基因位點與疾病的相關性是不斷進化的,我們正處在一個認知不斷提升的階段。通過過去的研究,我們已經逐步了解了一些基因突變和疾病的關系,多集中在罕見病、遺傳性腫瘤領域;隨著時間推移,科學不斷發(fā)展,將會有越來越多的遺傳信息位點會發(fā)現和疾病發(fā)病的相關性。

現在正處于一個基因與疾病相關性認知不斷提升的階段,因此,盡管已經知道了許多的基因突變可能造成疾病,但是仍有許多路要走。在不斷的科技進步中,越來越多的疾病相關性位點會被發(fā)現,人類基因和疾病的關系也會越來越明朗。

5總結

當再次回到“基因檢測的檢驗結果準確嗎?”這樣的問題時,通過上述闡述的內容就可以概括成:

1)測序結果與DNA實際的排列情況是否一致

對于測序的準確性來說,在一定的前提下,不管是一代測序(沒有錯峰套峰且背景干凈),二代測序(保證測序深度和處理的算法效果),三代測序(保證測序深度和處理的算法效果)還是芯片(保證設計合理和有效結合)的結果,都是準確的,基因檢測結果數據的準確性在不同平臺用不同的測序手段都可以很好的實現,但各個技術最終能獲得的有效信息量存在較大差異。

2)比對出的疾病易感位點,是否與疾病的發(fā)病真實相關

一般來說,基因檢測出了疾病發(fā)病的風險,首先看致病等級,是致病?還是危險因素?還是其他。當出現了上述兩種類型的位點時,就目前的數據來說是準確的。然而我們不可能了解到科學還沒有觸碰到的部分。因此從這個角度來看待結果,我們就不能確定檢測是100%準確的。包括:測出有風險的位點,可能會通過今后的研究被推翻;以及測出沒有風險的位點,會隨著科研的進步而出現風險。此外,仍有大量未知的基因位點與疾病的相關性,隨著科學的發(fā)展才能給予更篤定的證明。

因此在目前數據庫可靠的前提下,對于人類已知的疾病發(fā)病位點,我們的檢測保證與已有研究一致,則當下的基因檢測就能保證接近100%的準確度。這里依然不排除現有的權威研究在補充了更大量的人群后,現有結果又被推翻。因此基因檢測是一個不斷發(fā)展的漫長過程,需要更多的從業(yè)者,做更大量的樣本,這樣才能在未來形成疾病與基因突變的正確認知,更好的回答“基因檢測是否準確”這樣的問題。

作者:動脈網的小伙伴們

<上一頁  1  2  3  
聲明: 本文系OFweek根據授權轉載自其它媒體或授權刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內容、版權以及其它問題的,請聯系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號