首頁(yè) >> 科技服務(wù) >> 工作動(dòng)態(tài)

工作動(dòng)態(tài)

水生所對(duì)魚(yú)類(lèi)轉(zhuǎn)錄組相關(guān)數(shù)據(jù)庫(kù)的開(kāi)發(fā)取得突破

發(fā)表日期:2023-10-25郭成來(lái)源:水生生物研究所放大 縮小

   隨著各種魚(yú)類(lèi)的轉(zhuǎn)錄組研究的迅速開(kāi)展,大量的RNA-seq數(shù)據(jù)開(kāi)始公開(kāi),展現(xiàn)特定時(shí)間點(diǎn)下,目標(biāo)器官、組織或細(xì)胞中所有基因的表達(dá)情況,使得更為系統(tǒng)地理解魚(yú)類(lèi)基因表達(dá)的概況和細(xì)節(jié)成為可能。  

  中國(guó)科學(xué)院水生生物研究所魚(yú)類(lèi)功能基因組學(xué)學(xué)科組收集整理了魚(yú)類(lèi)RNA-seq相關(guān)數(shù)據(jù),建立了魚(yú)類(lèi)的常規(guī)轉(zhuǎn)錄組數(shù)據(jù)庫(kù)FishGETFish Transcriptome and Expression Database. http://bioinfo.ihb.ac.cn/fishget)、單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)庫(kù)FishSCTFish Single-Cell Transcriptome Database, http://bioinfo.ihb.ac.cn/fishsct)和空間轉(zhuǎn)錄組數(shù)據(jù)庫(kù)FishSEDFish Spatial Expression Database, http://bioinfo.ihb.ac.cn/fishsed  

  FishGET收錄了來(lái)自于斑馬魚(yú)、草魚(yú)和虹鱒等8種魚(yú)類(lèi)的97項(xiàng)研究共1362個(gè)樣本的RNA-seq雙端數(shù)據(jù)(包括mRNAlncRNA),進(jìn)行了轉(zhuǎn)錄本組裝、加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA)、NR/KEGG/GO注釋、臨近位置注釋、lncRNA類(lèi)型注釋和同源性注釋等工作。網(wǎng)站還提供了多樣化的動(dòng)態(tài)交互可視化服務(wù),用于查詢(xún)和展示魚(yú)類(lèi)不同發(fā)育階段各組織器官內(nèi)的基因表達(dá)和共表達(dá)網(wǎng)絡(luò)等,以期促進(jìn)魚(yú)類(lèi)基因在轉(zhuǎn)錄水平的相關(guān)研究(圖1)。  

1  FishGET功能模塊

  FishSCT收錄了包括斑馬魚(yú)等9種魚(yú)類(lèi)的數(shù)據(jù),也是斑馬魚(yú)單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)最齊全的在線(xiàn)資源。數(shù)據(jù)庫(kù)基于發(fā)表于202210月之前的44項(xiàng)研究的129個(gè)數(shù)據(jù)集,經(jīng)過(guò)統(tǒng)一分析獲得了964個(gè)標(biāo)記基因和26,965個(gè)潛在標(biāo)記基因信息,以及單細(xì)胞分辨率下的表達(dá)圖譜(細(xì)胞數(shù)目:646,641),共涵蓋9種魚(yú)類(lèi)的245種細(xì)胞類(lèi)型。斑馬魚(yú)的相關(guān)數(shù)據(jù)構(gòu)成數(shù)據(jù)庫(kù)的主體,包括222種細(xì)胞類(lèi)型的848個(gè)標(biāo)記和13,800個(gè)潛在標(biāo)記基因信息,所涉及的組織或器官涵蓋了斑馬魚(yú)生長(zhǎng)發(fā)育時(shí)間線(xiàn)的各個(gè)階段(2)。FishSCT提供了一個(gè)用戶(hù)友好的網(wǎng)絡(luò)界面,方便用戶(hù)瀏覽目標(biāo)基因的表達(dá)模式和標(biāo)記信息等內(nèi)容(圖3 A-D,并且提供了細(xì)胞類(lèi)型識(shí)別的功能(圖3 E-F),來(lái)幫助研究人員進(jìn)行scRNA-seq的相關(guān)分析。  

  

2  FishSCT數(shù)據(jù)庫(kù)中,斑馬魚(yú)及其它魚(yú)類(lèi)各組織/器官中細(xì)胞類(lèi)型和標(biāo)記基因的數(shù)量

3  FishSCT數(shù)據(jù)庫(kù)的基因表達(dá)可視化示例和細(xì)胞類(lèi)型識(shí)別功能。A-Dtubb5基因表達(dá)模式的可視化與蛋白互作網(wǎng)絡(luò)展示;E-F,細(xì)胞類(lèi)型識(shí)別功能

  FishSED整理了已公開(kāi)發(fā)表的斑馬魚(yú)空間轉(zhuǎn)錄組相關(guān)的原始數(shù)據(jù),涵蓋了來(lái)自10個(gè)項(xiàng)目的56個(gè)數(shù)據(jù)集的空間表達(dá)譜數(shù)據(jù)(圖4 A)。樣本類(lèi)型包括所有發(fā)育階段的胚胎和其他幾個(gè)組織,經(jīng)過(guò)分析和處理后,獲得了涵蓋5種測(cè)序技術(shù)的3D基因表達(dá)圖譜,建立了一個(gè)用戶(hù)友好、交互性強(qiáng)的斑馬魚(yú)空間轉(zhuǎn)錄組數(shù)據(jù)平臺(tái)。這是目前唯一的專(zhuān)門(mén)收錄斑馬魚(yú)空間轉(zhuǎn)錄組數(shù)據(jù)的數(shù)據(jù)庫(kù)。FishSED根據(jù)不同的測(cè)序技術(shù)提供了不同的可視化服務(wù),還可進(jìn)行跨數(shù)據(jù)集的多基因表達(dá)模式搜索與作圖,為研究者進(jìn)行比較分析提供了方便(圖4 B-G)。  

  

4  FishSED數(shù)據(jù)庫(kù)的內(nèi)容和可視化結(jié)果示例。A,FishSED數(shù)據(jù)庫(kù)的數(shù)據(jù)集分布統(tǒng)計(jì);B-G,不同測(cè)序技術(shù)的可視化結(jié)果示例

  以上數(shù)據(jù)庫(kù)的論文發(fā)表在《iScience》和《Science China Life Sciences》,由博士研究生郭成、段攸、葉偉東等人共同完成,夏曉勤研究員和石米娟副研究員為并列通訊作者,點(diǎn)擊可閱讀原文:FishGET, FishSCT, FishSED。本研究得到國(guó)家重點(diǎn)研發(fā)計(jì)劃“鯉鯽、草魚(yú)優(yōu)異種質(zhì)資源鑒定”課題(2021YFD1200804)、“重要養(yǎng)殖魚(yú)類(lèi)基因組選育與單性控制技術(shù)”任務(wù)(2018YFD0901201),以及中國(guó)科學(xué)院戰(zhàn)略先導(dǎo)科技專(zhuān)項(xiàng)(XDA24010206)課題“鯉模塊整合育種的生物信息學(xué)分析”任務(wù)的共同資助。

附件: