科研進(jìn)展
原生生物(Protist)是一大類單細(xì)胞真核生物的集合,包括單細(xì)胞真核藻類和原生動(dòng)物等,組成了原生生物界。原生生物具有高度多樣性,廣泛分布于各類水環(huán)境中,在生態(tài)平衡、物質(zhì)和能量循環(huán)、環(huán)境健康、動(dòng)植物疾病等方面至關(guān)重要。它們是水生態(tài)系統(tǒng)的重要組分,是重要的初級(jí)生產(chǎn)力和氧氣的制造者、碳循環(huán)的關(guān)鍵參與者,是水產(chǎn)動(dòng)物的優(yōu)良餌料、人類的營(yíng)養(yǎng)品、生物能源,是水環(huán)境的“哨兵”、水華和赤潮的重要元兇,是人、畜、禽、魚疾病的重要病原、互利共生的“好伙伴”。
NCBI分類系統(tǒng)已記錄的原生生物種類超過(guò)6萬(wàn)種,未知數(shù)量難以估量。2019年12月,由中國(guó)科學(xué)院水生生物研究所(水生所)牽頭發(fā)起了萬(wàn)種原生生物基因組計(jì)劃(Protist 10,000 Genomes Project,P10K),旨在建立一個(gè)大規(guī)模的原生生物遺傳資源數(shù)據(jù)庫(kù),變革原生生物遺傳資源數(shù)據(jù)極度缺乏的局面。
“萬(wàn)種原生生物基因組計(jì)劃(P10K)”的標(biāo)志。設(shè)計(jì)思路:標(biāo)志由不同原生生物組成。其中鐘蟲(纖毛蟲)代表字母“P”,裸藻(鞭毛蟲)和團(tuán)藻(綠藻)的組合代表數(shù)字“10”,阿米巴代表字母“K”。雙螺旋既代表DNA又代表水波,即原生生物生存的水環(huán)境。“P”中噴發(fā)出諸多原生生物,代表1676年列文虎克發(fā)現(xiàn)鐘蟲之后,高度多樣的各種原生生物被發(fā)現(xiàn)。
近日,由中國(guó)科學(xué)院水生生物研究所及北京基因組研究所(國(guó)家生物信息中心)聯(lián)合發(fā)布了P10K第一批數(shù)據(jù)。數(shù)據(jù)通過(guò)萬(wàn)種原生生物基因組數(shù)據(jù)庫(kù)(P10K database,https://ngdc.cncb.ac.cn/p10k/)共享發(fā)布釋放,相關(guān)論文以“The P10K database: a data portal for the protist 10000 genomes project”為題發(fā)表于Nucleic Acids Research。P10K第一批數(shù)據(jù)共收錄了2959個(gè)原生生物數(shù)據(jù)集,包括1601個(gè)基因組和1358個(gè)轉(zhuǎn)錄組數(shù)據(jù)集,覆蓋了原生生物75%的綱和45%的目。其中,從公共數(shù)據(jù)庫(kù)整合了1858個(gè)數(shù)據(jù)集,P10K團(tuán)隊(duì)新測(cè)序了1101個(gè)數(shù)據(jù)集,以原生動(dòng)物纖毛蟲(Ciliate)為主。新測(cè)序數(shù)據(jù)將原生生物數(shù)據(jù)集規(guī)模整體提升了37%。新測(cè)序的樣品由P10K團(tuán)隊(duì)從國(guó)內(nèi)多種生境中采集、分離。對(duì)于不能實(shí)驗(yàn)室培養(yǎng)的絕大部分原生動(dòng)物,采用了單細(xì)胞測(cè)序方法,占新測(cè)序數(shù)據(jù)的98%。同時(shí),為了解決大規(guī)模單細(xì)胞組學(xué)數(shù)據(jù)的分析問(wèn)題,P10K團(tuán)隊(duì)研發(fā)了一套針對(duì)原生生物單細(xì)胞測(cè)序數(shù)據(jù)的組裝、去污染、物種鑒定、基因注釋和評(píng)估的標(biāo)準(zhǔn)化分析流程。質(zhì)量評(píng)估顯示,該流程注釋的基因組與公共數(shù)據(jù)庫(kù)發(fā)布的基因組具有相似比例的中高等質(zhì)量數(shù)據(jù)。
P10K數(shù)據(jù)庫(kù)的特點(diǎn)和功能
水生所繆煒研究員、北京基因組所章張研究員與馬利娜副研究員為該文共同通訊作者,水生所博士研究生高欣欣、陳凱助理研究員、熊杰研究員、北京基因組所鄒東高級(jí)工程師為該文共同第一作者。該工作得到了科技部國(guó)家重點(diǎn)研發(fā)計(jì)劃、中科院先導(dǎo)專項(xiàng)、國(guó)際合作計(jì)劃、青年創(chuàng)新促進(jìn)會(huì)、國(guó)家自然科學(xué)基金和IUBS開(kāi)放生物多樣性和健康大數(shù)據(jù)計(jì)劃的資助,以及國(guó)家水生生物種質(zhì)資源庫(kù)和中國(guó)科學(xué)院超級(jí)計(jì)算武漢分中心的支持。
作為“萬(wàn)種原生生物基因組計(jì)劃”的重要組成部分,P10K數(shù)據(jù)庫(kù)的建立和數(shù)據(jù)共享將有助于推動(dòng)對(duì)真核生物和多細(xì)胞生物起源、真核生物多樣性、原生生物的極端環(huán)境適應(yīng)以及微生物互作等重要基礎(chǔ)科學(xué)問(wèn)題的研究。與此同時(shí),這項(xiàng)計(jì)劃將促進(jìn)對(duì)與生態(tài)環(huán)境保護(hù)、污染物降解和轉(zhuǎn)化、營(yíng)養(yǎng)健康以及疾病防治相關(guān)的原生生物遺傳資源的挖掘和潛在應(yīng)用。同時(shí),鑒于原生生物是浮游生物的關(guān)鍵組成部分,P10K數(shù)據(jù)庫(kù)還將為基于環(huán)境DNA的浮游生物鑒定提供支持,助力水生態(tài)健康評(píng)價(jià)。
尤為重要的是,P10K數(shù)據(jù)庫(kù)建立了國(guó)家水生生物種質(zhì)資源庫(kù)/國(guó)家寄生蟲資源庫(kù)(活體種質(zhì)資源)和國(guó)家基因組科學(xué)數(shù)據(jù)中心(遺傳資源)之間的緊密聯(lián)系,對(duì)于促進(jìn)國(guó)家科技資源共享服務(wù)平臺(tái)的信息互聯(lián)互通和數(shù)據(jù)共享具有重要意義。
P10K計(jì)劃鏈接:
https://www.cell.com/the-innovation/fulltext/S2666-6758(20)30061-8
P10K 數(shù)據(jù)庫(kù)論文原文:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkad992/7335744