發(fā)布日期:2016-08-15
艾吉泰康正在努力打造高通量序列設(shè)計(jì)引擎。我們自己有些感悟,就是探針引物在設(shè)計(jì)環(huán)節(jié)都是序列,在高通量的序列特征的分析,或者說設(shè)計(jì)環(huán)節(jié)當(dāng)中有很多的共性的東西。包括我們在基因捕獲里面,無論是高通量探針還是引物設(shè)計(jì),包括在其它的序列特征提取當(dāng)中很多規(guī)則是一樣的。所以我們可能會(huì)開發(fā)出越來越多的設(shè)計(jì)的應(yīng)用,并且做到線上為大家免費(fèi)提供服務(wù)。
實(shí)際上在互聯(lián)網(wǎng)的領(lǐng)域,我們把這個(gè)定義為一種SaaS服務(wù),就是一種非常專業(yè)的,高通量特征序列提取的一種業(yè)務(wù)流程。我們可以和專業(yè)的云計(jì)算的PaaS去配合(比如聚道云等),實(shí)際上我們今年一直在這個(gè)方面努力。因?yàn)樗恢皇且恍┥锏膯栴},還牽涉到一些算法優(yōu)化,還有硬件的事,確實(shí)花了一些的時(shí)間,期待能和更專業(yè)的IT背景的人或企業(yè)合作。在序列設(shè)計(jì)的領(lǐng)域,當(dāng)時(shí)我們已經(jīng)積累發(fā)表了一批SCI文章和專著,引用率和使用率頗高。
基因捕獲在技術(shù)原理上其實(shí)特別簡單。液相雜交法中首先將常規(guī)樣本的基因組打斷,然后根據(jù)測序儀器加接頭。我們設(shè)計(jì)的探針,會(huì)跟DNA隨機(jī)打斷的片段特異地互補(bǔ)結(jié)合,最后通過磁珠把捕獲的目標(biāo)區(qū)域吸附下來,吸附下來再經(jīng)過洗脫、純化、富集上機(jī)測序。可能不同的公司在這個(gè)里面有些細(xì)節(jié)不一樣,但是這些公共步驟都是一樣的。多重PCR就更簡單,實(shí)際上它在實(shí)驗(yàn)環(huán)節(jié)中只需經(jīng)過一輪或者兩輪PCR,直接得到產(chǎn)物就上機(jī)測序了。這個(gè)里面難點(diǎn)還是在設(shè)計(jì),以及實(shí)驗(yàn)條件的磨合上,實(shí)驗(yàn)步驟真的是特別簡單。
從解析這個(gè)角度上給大家交流一下,里面有哪些關(guān)鍵參數(shù)來評判基因檢測的好壞。第一個(gè)當(dāng)然是有目標(biāo)區(qū)域的測序量,覆蓋度,數(shù)據(jù)的均一性,代表著是它的可信度,也就是準(zhǔn)確度。所謂的均一性,形象一點(diǎn)比喻,你看reads的分布圖跟山峰一樣的,有高有低的那肯定就不均勻,在峰底的時(shí)候準(zhǔn)確度就特別低,峰頂是過度的高。還有一些標(biāo)準(zhǔn)就是重復(fù)率、捕獲效率,以及一些常規(guī)的測序質(zhì)量等等。這個(gè)捕獲效率我做了一個(gè)公式,講的比較直觀一點(diǎn)。比對到目標(biāo)區(qū)域的有效數(shù)據(jù)量除以比對到所有的人基因組區(qū)域的有效數(shù)據(jù)量就是捕獲效率。有效數(shù)據(jù)量是什么呢,你測序的時(shí)候會(huì)有重復(fù)率,用1減去這個(gè)重復(fù)率就是不重復(fù)率,不重復(fù)的達(dá)到QC標(biāo)準(zhǔn)比例再乘以原始數(shù)據(jù),就是這個(gè)有效數(shù)據(jù)。然后平均深度我們是這么定義的,比對到目標(biāo)區(qū)域的有效數(shù)據(jù)量除以panel區(qū)域的大小來計(jì)算平均深度。
重復(fù)率這一塊我們的去重標(biāo)準(zhǔn)是非常嚴(yán)格的,只允許唯一一條,其它的都叫重復(fù)。目前部分企業(yè)篩選標(biāo)準(zhǔn)比較低,允許三條,會(huì)對檢測結(jié)果造成很大的解讀隱患。下一頁展示的是在panel檢測中可以通過增加測序深度提高準(zhǔn)確度,你看在五十層的時(shí)候這個(gè)是一個(gè)純合突變,到三百層的時(shí)候就被發(fā)現(xiàn)是雜合突變,明顯表明測序深度能夠部分解決準(zhǔn)確度的問題。
靶向捕獲的研究和臨床應(yīng)用
下面我講一些具體的應(yīng)用案例。捕獲測序首先在基礎(chǔ)科研上有一些應(yīng)用,最近我們探索地跟一些研究所在基因組編輯的脫靶效應(yīng)優(yōu)化上面做的一些合作開發(fā),然后在單細(xì)胞測序上面,經(jīng)過上游的細(xì)胞捕獲,然后擴(kuò)增,下游再接上基因捕獲看看這個(gè)數(shù)據(jù)效果怎么樣。
另外像液體活檢ctDNA的這一塊也是比較多的應(yīng)用。另外其實(shí)我們剛才聊了很多的東西都是基于基因組的。舉個(gè)案例,就是基因組編輯的定制化的全基因組脫靶優(yōu)化方案,實(shí)際上它會(huì)有一些目標(biāo)基因,我們會(huì)對這個(gè)目標(biāo)利用靶向測序技術(shù)分析它的脫靶效應(yīng),看能不能通過靶向測序把它給鑒定出來,然后優(yōu)化實(shí)驗(yàn)的過程。首先它會(huì)有一些目標(biāo)基因,比如說這個(gè)案例里面,就是DMD基因。我們會(huì)在全基因組范圍內(nèi)預(yù)測它的脫靶位點(diǎn),然后從篩選這些位點(diǎn)進(jìn)行編輯實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果會(huì)通過表型,無論細(xì)胞表型還是動(dòng)物表型去查看。這時(shí)候其實(shí)還不能確定脫靶位點(diǎn),然后可以通過把和表型關(guān)聯(lián)的預(yù)測的這些脫靶位點(diǎn)進(jìn)行捕獲測序,精確地告訴大家,基因是否在其他的基因組區(qū)域上脫靶了,脫靶的基因型是什么?
另外在臨床基因檢測中應(yīng)用最多的是SNP的發(fā)現(xiàn)和檢測,同時(shí)其它基因組變異的篩查研究也特別多。我們舉一些案例。這個(gè)是一個(gè)遺傳病的panel,可以用來發(fā)現(xiàn)拷貝數(shù)的變異,右上直方圖是父親、母親、孩子的拷貝數(shù)體現(xiàn),能夠發(fā)現(xiàn)顯著的差異,藍(lán)色的區(qū)域就是拷貝數(shù)的變化的量,這個(gè)能夠確定拷貝數(shù)斷點(diǎn)的位置。基因捕獲技術(shù)還可以發(fā)現(xiàn)特別大片段基因的缺失,有些常規(guī)的分子生物技術(shù)還做不到。
這是展示的胰腺癌的一個(gè)樣本中拷貝數(shù)變異,ERBB2的基因擴(kuò)增是跟很多靶向藥物用藥相關(guān)聯(lián)的,有助于協(xié)助醫(yī)生判斷對患者進(jìn)行異病同治。
這個(gè)是我們做的一個(gè)panel,發(fā)現(xiàn)中國人群前列腺癌樣本中的基因融合現(xiàn)象,因?yàn)榛蛉诤嫌械臅r(shí)候比較復(fù)雜,它的融合點(diǎn)準(zhǔn)確位置并不確定,而且有一些文獻(xiàn)報(bào)道的也是歐美人群的數(shù)據(jù)。當(dāng)你不知道這個(gè)融合點(diǎn)位置的時(shí)候,在設(shè)計(jì)引物和探針的時(shí)候非常困難。實(shí)際上這個(gè)是發(fā)現(xiàn)了一個(gè)比較典型的三基因融合的現(xiàn)象,就是Gene-1、Gene-2,包括這個(gè)ETV1的一個(gè)3基因的融合,在一代測序上面得到了驗(yàn)證。
這個(gè)是食管癌的panel檢測案例,文獻(xiàn)報(bào)道的有一個(gè)C1QTNF3-AMACR的基因融合。但是我們還發(fā)現(xiàn)了另外六個(gè)新的融合事件。Gene3和MECOM的融合,Gene4和VMP1的融合。這個(gè)也是剛才發(fā)現(xiàn)了更多復(fù)雜的融合的變異結(jié)構(gòu),通過生物信息可以把他們的基因的結(jié)構(gòu)給復(fù)原出來。
艾吉泰康做了很多上游panel設(shè)計(jì)和開發(fā),因此我們對panel基因檢測本身的技術(shù)參數(shù)非常了解,我們也發(fā)現(xiàn)了產(chǎn)業(yè)內(nèi)現(xiàn)存的一些質(zhì)控問題。只有做好指控,并對技術(shù)指標(biāo)的解讀標(biāo)準(zhǔn)非常清晰,才能真正做到精準(zhǔn)檢測。
基因檢測上游的測序技術(shù),包括基因捕獲技術(shù)在國內(nèi)都處于發(fā)展早期和追趕期,行業(yè)標(biāo)準(zhǔn)也沒有形成規(guī)范。我們長期和行業(yè)內(nèi)企業(yè)合作,都是從原始數(shù)據(jù)到生物信息的各個(gè)層次的數(shù)據(jù)的整體交付,這樣數(shù)據(jù)質(zhì)量問題永遠(yuǎn)可追溯。跟我們打交道的大部分都是企業(yè)內(nèi)的專業(yè)技術(shù)人員,好多像郝向穩(wěn)先生、田埂博士這樣的。他們會(huì)第一時(shí)間給我們反饋數(shù)據(jù)里面的問題。但是我們在做臨床基因檢測的時(shí)候,大部分的企業(yè)都是發(fā)布臨床報(bào)告,醫(yī)生并不能發(fā)現(xiàn)其中的數(shù)據(jù)質(zhì)量上的一些瑕疵。所以需要我們這些從業(yè)者以職業(yè)道德去做好質(zhì)控,每個(gè)技術(shù)指標(biāo)標(biāo)準(zhǔn)都要非常清晰。
其實(shí)目前基因檢測市場上還是良莠不齊,有很多由于數(shù)據(jù)質(zhì)控造成的問題。這個(gè)案例就是測序質(zhì)量的問題,測序質(zhì)量低不篩除掉直接發(fā)報(bào)告導(dǎo)致了假陽性。測序質(zhì)量不高的只有一個(gè)辦法,就是重測。覆蓋率,這個(gè)就是panel的問題,捕獲區(qū)域完全沒有覆蓋完整,然后還直接去發(fā)臨床報(bào)告,直接認(rèn)定為陰性就傳遞給醫(yī)生了。我們重新設(shè)計(jì)了這個(gè)panel保證了覆蓋率,發(fā)現(xiàn)覆蓋到的這個(gè)區(qū)域應(yīng)該是陽性結(jié)果。這個(gè)是測序深度的問題。
剛才說到測序深度不夠的時(shí)候,一開始是純合突變,但是增加測序深度你會(huì)發(fā)現(xiàn)變成雜合突變了。這個(gè)數(shù)據(jù)可信度是指的均一性,當(dāng)這個(gè)均一性不高的時(shí)候,我剛才做的一個(gè)比喻,它是像山峰一樣,當(dāng)你剛好你關(guān)注的突變點(diǎn)位于這個(gè)山峰的谷底的時(shí)候,這可能就是一個(gè)錯(cuò)誤的結(jié)果,你去拿去驗(yàn)證,跟它的結(jié)果剛好相反。這個(gè)均一性,如果一個(gè)panel在一層、四層、十層、二十層的時(shí)候平均覆蓋度分別是100%、100%、99%、99%這個(gè)下降程度,說明這個(gè)panel均一性很好,但如果覆蓋度分別是90%、80%、70%、60%這個(gè)下降程度時(shí),一般達(dá)不到臨床級的應(yīng)用,到不了95%以上的話可能都是要直接重做的。還有這個(gè)重復(fù)率的問題,這個(gè)結(jié)果重復(fù)率非常高,這個(gè)公司在做生物信息分析的時(shí)候的去重率標(biāo)準(zhǔn)放的特別寬,有了三條以上的重復(fù)它才去重。就會(huì)造成什么呢?他們真實(shí)的測序深度是假的,間接地造成了實(shí)際上因?yàn)橹貜?fù)率比較寬松,給你報(bào)告的達(dá)到100層了,但實(shí)際上才測了30層。30層就回到剛才那個(gè)問題,有的區(qū)域可能就不準(zhǔn)吧,你測出來也是假陰性,這個(gè)機(jī)率非常大。所以最好還是在這些指標(biāo)上要非常清晰的嚴(yán)格指控。
精準(zhǔn)醫(yī)療基因檢測是否精準(zhǔn)?在中國目前還是一個(gè)任重而道遠(yuǎn)的問題。我們各個(gè)環(huán)節(jié)的從業(yè)者必須從技術(shù)創(chuàng)新、技術(shù)標(biāo)準(zhǔn)、技術(shù)質(zhì)控,到后續(xù)的技術(shù)服務(wù)上用心去做,打造中國質(zhì)造,才能達(dá)到真正的精準(zhǔn)檢測的終極目標(biāo)。
服務(wù)模式探討
我們提了一個(gè)概念叫“中國質(zhì)造”,不光是能生產(chǎn),最重要的是質(zhì)量,在醫(yī)療應(yīng)用場景中,我們技術(shù)指標(biāo)可能達(dá)到了99.9%,但那0.01%到患者那兒,對他個(gè)體就是100%。這是我們的試劑盒及試劑盒里試劑的組成。過去一年我們和國內(nèi)近80家機(jī)構(gòu)訂制開發(fā)了近一百個(gè)panel。
目前相對于那些國際競品,我們現(xiàn)在的技術(shù)指標(biāo)能夠做到跟他們基本上不分伯仲。我們的采購鏈、制造基本都在國內(nèi),訂制開發(fā)速度比較快,同時(shí)試劑盒交付時(shí)嚴(yán)格質(zhì)控,同時(shí)交付實(shí)際捕獲和NGS測序的質(zhì)控結(jié)果。送測檢測服務(wù)一般根據(jù)你的時(shí)間和不同成本的要求,從兩周到一個(gè)月都有相關(guān)的服務(wù)。第一種就是說試劑和采購,基因列表提出來,我們通過設(shè)計(jì)開發(fā)質(zhì)控完了以后,把試劑盒交付給大家,然后通過標(biāo)準(zhǔn)的protocol在自己的實(shí)驗(yàn)室進(jìn)行操作。第二個(gè)合作模式是新技術(shù)的合作開發(fā)。就是因?yàn)橛行┊a(chǎn)品比較新,確實(shí)我們標(biāo)準(zhǔn)服務(wù)里沒有,但是我們對任何的產(chǎn)品開發(fā)都是一種比較開放的合作態(tài)度,以技術(shù)開發(fā)的形式進(jìn)行合作。第三就是服務(wù),你也可以送樣服務(wù),目前我們的測序通量還比較大,能夠協(xié)助大家把時(shí)間和測序的成本降下來,測序成本優(yōu)勢比較明顯。
來源:貝殼社