脊椎動物基因組計劃(VGP)和合作者在此宣布的脊椎動物染色體水平基因組組成中數(shù)量最多的第二個數(shù)據(jù)集(101個)完成了VGP,包括一個代表性物種或每個脊椎動物260個物種的第一階段。這101個基因組中的大部分已經(jīng)完成或處于組裝的最后階段,這證明了VGP在利用和開發(fā)實驗和計算工具以實現(xiàn)可擴(kuò)展性和實現(xiàn)在染色體水平上生產(chǎn)高質(zhì)量、無錯誤和完整基因組成分的目標(biāo)方面的成功。地球上存在著7萬種脊椎動物。由于物種識別和分類的更新,自第一個數(shù)據(jù)集以來,VGP已將脊椎動物物種的數(shù)量從66,000種增加了。
這些基因組將有助于解決生物學(xué)、醫(yī)學(xué)和保護(hù)方面的問題,包括對生命、疾病和生物多樣性的研究,如生成更完整和準(zhǔn)確的脊椎動物譜系,破譯脊椎動物染色體基因組進(jìn)化,比較基因組學(xué)(即聲樂)學(xué)習(xí)相似性狀,飛行、肢體缺失和水生/陸生適應(yīng),以及重建所有脊椎動物和關(guān)鍵脊椎動物進(jìn)化分支(如哺乳動物、鳥類、爬行動物和兩棲動物)
VGP現(xiàn)在已經(jīng)能夠擴(kuò)展到每月約10個基因組,這比自2018年9月第一組15個基因組數(shù)據(jù)以來每月約1個基因組的速度高出10倍。此前的公告確立了G10K -VGP聯(lián)盟的優(yōu)勢和新測序技術(shù)的能力,可靠地實現(xiàn)了高質(zhì)量、無錯誤的分階段參考基因組,并對其進(jìn)行了進(jìn)一步改進(jìn),以生成更高質(zhì)量的基因組組裝體。
幾乎所有的基因組都是與科學(xué)家個人或其他財團(tuán)項目合作完成的,包括25種脊椎動物、Bat1K基因組和韋爾科姆桑格研究所的B10K鳥類基因組。大部分基因組數(shù)據(jù)是在三個投資VGP任務(wù)的測序中心產(chǎn)生的,包括美國紐約洛克菲勒大學(xué)脊椎動物基因組實驗室(VGL)、德國德累斯頓的韋爾科姆桑格研究所和馬克斯普朗克研究所(MPI)。它由馬里蘭州貝塞斯達(dá)國家健康研究所VGP大會小組主席亞當(dāng)菲利普、VGL團(tuán)隊成員奧利維爾費德里戈、劍橋大學(xué)的理查德杜賓和MPI的吉恩邁爾斯領(lǐng)導(dǎo)。VGP在DNANexus上建立了一個新的基因組組裝管道,這是一個基于云的基因組計算平臺。
這些新組件包括他們和其他人在基因組測序和組裝技術(shù)方面所做的改進(jìn),因為第一個數(shù)據(jù)集可以更好地解決尋找導(dǎo)致基因組組裝錯誤的父系和母系染色體序列的問題。這些物種中的許多已經(jīng)組裝了早期版本的基因組,但由于這些以前的組裝過于分散,不符合VGP設(shè)定的質(zhì)量指標(biāo),他們重新檢查了VGP協(xié)助的新的長閱讀脫氧核糖核酸測序和染色體組裝技術(shù)。發(fā)展。
G10K主席、洛克菲勒大學(xué)教授、霍華德休斯醫(yī)學(xué)研究所研究員Erich Jarvis表示:“第二組數(shù)據(jù)證明,VGP能夠匯聚國際集體智慧和專業(yè)知識,以最低成本、盡可能好的科學(xué)、為人類和其他物種的利益,生產(chǎn)出最高質(zhì)量的基因組數(shù)據(jù)”。
101種中,脊椎動物100種,無脊椎動物1種,是桑格研究所25個基因組項目貢獻(xiàn)的海星,為其他類群的近親。100種脊椎動物代表77個分類序列,這是首次對這種完整性進(jìn)行測序。與以往數(shù)據(jù)集中的13種相比,增加了第一種的90 ~260種。這些基因組包括標(biāo)志性物種,如最大的脊椎動物藍(lán)鯨,以及寬吻海豚、長尾小鸚鵡、mar猴、紅腹食人魚、大白癡和無顎鰻魚(一種原始魚類)。
愛爾蘭都柏林大學(xué)教授、Bat1K聯(lián)合主任艾瑪?shù)倭?Emma Teeling)表示,“我們已經(jīng)完成了實驗研究,并對6個蝙蝠物種的基因組進(jìn)行了測序,這些蝙蝠物種來自從系統(tǒng)發(fā)育到染色體水平組裝不同的家族。這些基因組揭示了一些獨特的基因組適應(yīng)與飛行,回聲定位和非凡的免疫力哺乳動物。
對于保護(hù)工作,這些基因組將被用來幫助識別瀕臨滅絕的遺傳物種,保存未來的遺傳信息,并幫助將它們從人類造成的第六次大規(guī)模滅絕中拯救出來。該數(shù)據(jù)集包括4種極度瀕危物種(瓦奎塔、歐洲鰻、波松龜和小鋸齒)、7種瀕危物種(藍(lán)鯨、灰冠鶴、綠海龜、大西洋大比目魚、環(huán)尾狐猴、黑猩猩和金斑魚)和8種易受傷害物種(小魚、狡猾的溜冰、暹羅魚、紅阿比犀鳥、大白鯊和棱皮龜)
瓦奎塔可能是這個群體中最關(guān)鍵的。通過VGL洛克菲勒大學(xué)的杰奎琳蒙卡塞爾,VGP與墨西哥研究人員和國家海洋和大氣管理局的菲利普莫蘭進(jìn)行了合作。墨西哥海豚意外被漁網(wǎng)捕獲,為了供應(yīng)中國的黑色野生動物市場,恢復(fù)了對瀕危魚類的非法捕撈,這加速了下降,每年有近一半的海豚死亡。來自9個國家的90名研究人員參與了2017年的一項救援工作,試圖捕獲留在加利福尼亞灣的30只瓦基塔,以拯救它們免于滅絕。不幸的是,當(dāng)時捕獲的一只動物在休克后不久死亡,但她的活細(xì)胞在圣地亞哥冷凍動物園進(jìn)行了培養(yǎng)和冷凍,然后用于生成高質(zhì)量的參考基因組序列。今年,萊昂納多迪卡普里奧制作了一張唱片
片“陰影之海”(the Sea of?? Shadows),以紀(jì)念小城鎮(zhèn)的困境,以幫助建立公眾支持,使其免于瀕臨滅絕; 該紀(jì)錄片包括VGP測序和組裝的基因組的女性。她的染色體是高度純合的,但初步分析表明,這是由于成千上萬年的持續(xù)存在作為一個小群體,而不是最近可能加速滅絕的多樣性喪失。Phillip Morin說:“vaquita基因組分析提供了一個強(qiáng)有力的反對遺傳厄運的共同論點,這種論證已被反復(fù)提出作為反對試圖拯救物種的紅鯡魚論點。” 萊昂納多·迪卡普里奧(Leonardo Dicaprio)制作了一部紀(jì)錄片“陰影之海”(the Sea of?? Shadows),講述了小丑的困境,以幫助建立公眾支持,使其免于瀕臨滅絕; 該紀(jì)錄片包括VGP測序和組裝的基因組的女性。她的染色體是高度純合的,但初步分析表明,這是由于成千上萬年的持續(xù)存在作為一個小群體,而不是最近可能加速滅絕的多樣性喪失。Phillip Morin說:“vaquita基因組分析提供了一個強(qiáng)有力的反對遺傳厄運的共同論點,這種論證已被反復(fù)提出作為反對試圖拯救物種的紅鯡魚論點。” 萊昂納多·迪卡普里奧(Leonardo Dicaprio)制作了一部紀(jì)錄片“陰影之海”(the Sea of?? Shadows),講述了小丑的困境,以幫助建立公眾支持,使其免于瀕臨滅絕; 該紀(jì)錄片包括VGP測序和組裝的基因組的女性。她的染色體是高度純合的,但初步分析表明,這是由于成千上萬年的持續(xù)存在作為一個小群體,而不是最近可能加速滅絕的多樣性喪失。Phillip Morin說:“vaquita基因組分析提供了一個強(qiáng)有力的反對遺傳厄運的共同論點,這種論證已被反復(fù)提出作為反對試圖拯救物種的紅鯡魚論點。” 該紀(jì)錄片包括VGP測序和組裝的基因組的女性。她的染色體是高度純合的,但初步分析表明,這是由于成千上萬年的持續(xù)存在作為一個小群體,而不是最近可能加速滅絕的多樣性喪失。Phillip Morin說:“vaquita基因組分析提供了一個強(qiáng)有力的反對遺傳厄運的共同論點,這種論證已被反復(fù)提出作為反對試圖拯救物種的紅鯡魚論點。” 該紀(jì)錄片包括VGP測序和組裝的基因組的女性。她的染色體是高度純合的,但初步分析表明,這是由于成千上萬年的持續(xù)存在作為一個小群體,而不是最近可能加速滅絕的多樣性喪失。Phillip Morin說:“vaquita基因組分析提供了一個強(qiáng)有力的反對遺傳厄運的共同論點,這種論證已被反復(fù)提出作為反對試圖拯救物種的紅鯡魚論點。”同樣,馬薩諸塞大學(xué)阿默斯特分校保護(hù)基因組學(xué)和生態(tài)生理學(xué)助理教授Lisa M. Komoroske領(lǐng)導(dǎo)了為VGP為太平洋棱皮龜基因組籌集資金的工作,他說:“人口減少了90%以上這主要是由于直接收獲和漁業(yè)相互作用等人類活動造成的。太平洋棱皮龜是近期受瀕臨滅絕的美國NOAA保護(hù)的八種瀕臨滅絕的物種之一。物種法,“Komoroske繼續(xù)。“通常被稱為'活恐龍',棱皮龜是一種古老的血統(tǒng),具有獨特的生理適應(yīng)能力,
該數(shù)據(jù)集還包括12個基于三個組件,其中父母的DNA用于分離兒童染色體的DNA序列以組裝來自一個個體的兩個基因組(一個來自母親和父親):斑胸草雀,寬吻海豚,常見的刷尾負(fù)鼠,普通mar猴,尼羅鼠,虎皮鸚鵡,雞,布爾森龜,沙漏樹蛙,斑馬魚SAT,小品種和人類?;谟蒒HGRI的Phillippy實驗室的Sergey Koren和Arang Rhie開發(fā)的組裝方法,這些基于三重組的組件在分離出親本遺傳的DNA時比非三重組件好40-60%。正在進(jìn)行的新雞三重奏組合預(yù)計將改進(jìn)農(nóng)業(yè)和生物醫(yī)學(xué)研究,因為雞是這些地區(qū)最常研究的禽類基因組。
這些基因組已被用于培訓(xùn)下一代科學(xué)家如何生產(chǎn)高質(zhì)量的染色體水平參考組件。Arang Rhie博士在開發(fā)用于生成高質(zhì)量VGP組件的計算管道方面發(fā)揮了關(guān)鍵作用,對國際學(xué)生進(jìn)行了在線培訓(xùn)和監(jiān)督,然后組裝了101個基因組中的許多。為新手研究人員提供的這一培訓(xùn)機(jī)會有助于實現(xiàn)民主化和擴(kuò)大高質(zhì)量參考基因組的產(chǎn)生; 在未來,這個機(jī)會將使每年生成數(shù)千個基因組,以滿足VGP和相關(guān)項目的雄心勃勃的目標(biāo)。
新的序列存儲在Genome Ark數(shù)據(jù)庫中并公開提供,該數(shù)據(jù)庫是由G10K聯(lián)盟生成并由亞馬遜托管的新的基因組數(shù)字庫,并在國際公共基因組瀏覽和分析數(shù)據(jù)庫(包括國家生物技術(shù)信息中心)中進(jìn)行注釋和顯示( NCBI),歐洲生物信息學(xué)研究所的Ensembl和UCSC基因組瀏覽器 - UC Santa Cruz Genomics Institute的一部分 - 最近推出了24種脊椎動物組件。在101個中,有60個可以立即使用,其他的很快就可以存放,所有這些都符合G10K數(shù)據(jù)使用政策,以確保公平的數(shù)據(jù)使用和發(fā)布。
所有70,000種脊椎動物物種的序列需要大約6億美元。我們目前專注于完成第1階段,該階段將通過科學(xué)家之間的眾包提供所有260種脊椎動物訂單的代表性參考序列,并成功地將迄今為止需要的600萬美元中的480萬美元投入資金(階段1 物種的樣本和資金可用性可在此處獲得))。