據(jù)物理學(xué)家組織網(wǎng)5月5日?qǐng)?bào)道,zui近,美國(guó)能源部聯(lián)合基因組研究所(DOE JGI)、太平洋生物科學(xué)公司(PacBio)與華盛頓大學(xué)合作,開(kāi)發(fā)出一種改良的基因組組裝工藝流程,生成的讀取片段達(dá)到數(shù)萬(wàn)個(gè)核苷酸長(zhǎng)度,zui終的組裝序列準(zhǔn)確率大于99.999%。以往的桑格技術(shù)只有700個(gè)核苷酸,新工藝大大提高了測(cè)序組裝和分析的成本效益。相關(guān)論文在線發(fā)表于5月5日的《自然·方法學(xué)》上。
人們?cè)诮档统杀竞虳NA測(cè)序通量上已取得巨大進(jìn)步,但在重建基因組過(guò)程中,仍面臨很大挑戰(zhàn)。現(xiàn)有技術(shù)擅于造出短DNA字母片段(讀取片段),經(jīng)過(guò)計(jì)算把它們拼一起(組裝)成為長(zhǎng)鏈,以此來(lái)確定目標(biāo)序列中這些字母的序列和功能。基因組裝就好比把幾百萬(wàn)的“拼圖”拼在一起,而事先不知道原圖是什么樣子。由于DNA段非常小而數(shù)量卻極大,用目前流行方法來(lái)組裝非常困難。
研究小組描述這一工藝為“從DNA樣品制備到zui終基因組確定的全自動(dòng)過(guò)程”,所用技術(shù)叫做HGAP(分級(jí)基因組組裝過(guò)程)。利用太平洋生物科學(xué)公司的單分子實(shí)時(shí)DNA測(cè)序平臺(tái),生成的讀取片段達(dá)到數(shù)萬(wàn)個(gè)核苷酸長(zhǎng)度,比人類基因組計(jì)劃時(shí)期的主力技術(shù)——桑格測(cè)序技術(shù)還要長(zhǎng)。
桑格技術(shù)只能產(chǎn)出約700個(gè)核苷酸的讀取片段,而且要建多個(gè)DNA庫(kù)控制多種運(yùn)行,結(jié)合數(shù)據(jù)分析才能填補(bǔ)堿基編碼空缺。后桑格法也需要多個(gè)庫(kù),但結(jié)合了優(yōu)選技術(shù)。據(jù)研究小組報(bào)告,HGAP則相反, “只需準(zhǔn)備一個(gè)DNA庫(kù),就會(huì)自動(dòng)連續(xù)不斷地讀取單分子實(shí)時(shí)測(cè)序完成組裝,而不需要循環(huán)一致測(cè)序。” 他們還用DOE JGI以往測(cè)序過(guò)的3種細(xì)菌對(duì)新方法進(jìn)行了測(cè)試,收集數(shù)據(jù)進(jìn)行了對(duì)比,發(fā)現(xiàn)HGAP方法zui終組裝好的序列準(zhǔn)確率大于99.999%。
“我們一直在尋找新做法,在產(chǎn)出高質(zhì)量數(shù)據(jù)的同時(shí)提率。”DOE JGI基因組技術(shù)副主管蘭恩·潘那奇奧說(shuō),“我們?cè)谘芯慷喾N改良技術(shù)以實(shí)現(xiàn)規(guī)模經(jīng)濟(jì)效益,這只是其中之一。”在*已完成或正在進(jìn)行的兩萬(wàn)多個(gè)基因組項(xiàng)目中,超過(guò)20%在使用DOE JGI的測(cè)序技術(shù),大多集中在環(huán)境生物學(xué)、能源和碳處理方面。目前,研究小組正在進(jìn)一步擴(kuò)展這種新方法的應(yīng)用范圍,以研究更復(fù)雜有機(jī)生物的基因組。
太平洋生物科學(xué)公司科學(xué)官喬納斯·克拉奇也表示,通過(guò)與JGI微生物和微生物基因組組裝與注釋領(lǐng)域的科學(xué)家合作,他們才能改變單分子測(cè)序組裝方法,使組裝結(jié)果質(zhì)量更高,而且在速度和價(jià)格方面能與下一代測(cè)序與組裝方法競(jìng)爭(zhēng)。