首頁 >> 科技服務(wù) >> 工作動態(tài)

工作動態(tài)

萬種原生生物基因組計劃取得階段性進(jìn)展

發(fā)表日期:2023-11-21熊杰來源:水生生物研究所放大 縮小

  原生生物(Protist)是一大類單細(xì)胞真核生物的集合,包括單細(xì)胞真核藻類和原生動物等,組成了原生生物界。原生生物具有高度多樣性,廣泛分布于各類水環(huán)境中,在生態(tài)平衡、物質(zhì)和能量循環(huán)、環(huán)境健康、動植物疾病等方面至關(guān)重要。它們是水生態(tài)系統(tǒng)的重要組分,是重要的初級生產(chǎn)力和氧氣的制造者、碳循環(huán)的關(guān)鍵參與者,是水產(chǎn)動物的優(yōu)良餌料、人類的營養(yǎng)品、生物能源,是水環(huán)境的“哨兵”、水華和赤潮的重要元兇,是人、畜、禽、魚疾病的重要病原、互利共生的“好伙伴”。 

  NCBI分類系統(tǒng)已記錄的原生生物種類超過6萬種,未知數(shù)量難以估量。201912月,由中國科學(xué)院水生生物研究所(水生所)牽頭發(fā)起了萬種原生生物基因組計劃(Protist 10,000 Genomes Project,P10K),旨在建立一個大規(guī)模的原生生物遺傳資源數(shù)據(jù)庫,變革原生生物遺傳資源數(shù)據(jù)極度缺乏的局面。 

“萬種原生生物基因組計劃(P10K)”的標(biāo)志。設(shè)計思路:標(biāo)志由不同原生生物組成。其中鐘蟲(纖毛蟲)代表字母“P”,裸藻(鞭毛蟲)和團(tuán)藻(綠藻)的組合代表數(shù)字“10”,阿米巴代表字母“K”。雙螺旋既代表DNA又代表水波,即原生生物生存的水環(huán)境。“P”中噴發(fā)出諸多原生生物,代表1676年列文虎克發(fā)現(xiàn)鐘蟲之后,高度多樣的各種原生生物被發(fā)現(xiàn)。

    

  近日,由中國科學(xué)院水生生物研究所及北京基因組研究所(國家生物信息中心)聯(lián)合發(fā)布了P10K第一批數(shù)據(jù)。數(shù)據(jù)通過萬種原生生物基因組數(shù)據(jù)庫(P10K database,https://ngdc.cncb.ac.cn/p10k/)共享發(fā)布釋放,相關(guān)論文以“The P10K database: a data portal for the protist 10000 genomes project”為題發(fā)表于Nucleic Acids ResearchP10K第一批數(shù)據(jù)共收錄了2959個原生生物數(shù)據(jù)集,包括1601個基因組和1358個轉(zhuǎn)錄組數(shù)據(jù)集,覆蓋了原生生物75%的綱和45%的目。其中,從公共數(shù)據(jù)庫整合了1858個數(shù)據(jù)集,P10K團(tuán)隊新測序了1101個數(shù)據(jù)集,以原生動物纖毛蟲(Ciliate)為主。新測序數(shù)據(jù)將原生生物數(shù)據(jù)集規(guī)模整體提升了37%。新測序的樣品由P10K團(tuán)隊從國內(nèi)多種生境中采集、分離。對于不能實驗室培養(yǎng)的絕大部分原生動物,采用了單細(xì)胞測序方法,占新測序數(shù)據(jù)的98%。同時,為了解決大規(guī)模單細(xì)胞組學(xué)數(shù)據(jù)的分析問題,P10K團(tuán)隊研發(fā)了一套針對原生生物單細(xì)胞測序數(shù)據(jù)的組裝、去污染、物種鑒定、基因注釋和評估的標(biāo)準(zhǔn)化分析流程。質(zhì)量評估顯示,該流程注釋的基因組與公共數(shù)據(jù)庫發(fā)布的基因組具有相似比例的中高等質(zhì)量數(shù)據(jù)。 

P10K數(shù)據(jù)庫的特點和功能

    

  水生所繆煒研究員、北京基因組所章張研究員與馬利娜副研究員為該文共同通訊作者,水生所博士研究生高欣欣、陳凱助理研究員、熊杰研究員、北京基因組所鄒東高級工程師為該文共同第一作者。該工作得到了科技部國家重點研發(fā)計劃、中科院先導(dǎo)專項、國際合作計劃、青年創(chuàng)新促進(jìn)會、國家自然科學(xué)基金和IUBS開放生物多樣性和健康大數(shù)據(jù)計劃的資助,以及國家水生生物種質(zhì)資源庫和中國科學(xué)院超級計算武漢分中心的支持。 

  作為“萬種原生生物基因組計劃”的重要組成部分,P10K數(shù)據(jù)庫的建立和數(shù)據(jù)共享將有助于推動對真核生物和多細(xì)胞生物起源、真核生物多樣性、原生生物的極端環(huán)境適應(yīng)以及微生物互作等重要基礎(chǔ)科學(xué)問題的研究。與此同時,這項計劃將促進(jìn)對與生態(tài)環(huán)境保護(hù)、污染物降解和轉(zhuǎn)化、營養(yǎng)健康以及疾病防治相關(guān)的原生生物遺傳資源的挖掘和潛在應(yīng)用。同時,鑒于原生生物是浮游生物的關(guān)鍵組成部分,P10K數(shù)據(jù)庫還將為基于環(huán)境DNA的浮游生物鑒定提供支持,助力水生態(tài)健康評價。 

  尤為重要的是,P10K數(shù)據(jù)庫建立了國家水生生物種質(zhì)資源庫/國家寄生蟲資源庫(活體種質(zhì)資源)和國家基因組科學(xué)數(shù)據(jù)中心(遺傳資源)之間的緊密聯(lián)系,對于促進(jìn)國家科技資源共享服務(wù)平臺的信息互聯(lián)互通和數(shù)據(jù)共享具有重要意義。 

  P10K計劃鏈接: 

  https://www.cell.com/the-innovation/fulltext/S2666-6758(20)30061-8 

  P10K 數(shù)據(jù)庫論文原文: 

  https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkad992/7335744

 

附件: