科研進展
隨著各種魚類的轉(zhuǎn)錄組研究的迅速開展,大量的RNA-seq數(shù)據(jù)開始公開,展現(xiàn)特定時間點下,目標器官、組織或細胞中所有基因的表達情況,使得更為系統(tǒng)地理解魚類基因表達的概況和細節(jié)成為可能。
中國科學院水生生物研究所魚類功能基因組學學科組收集整理了魚類RNA-seq相關數(shù)據(jù),建立了魚類的常規(guī)轉(zhuǎn)錄組數(shù)據(jù)庫FishGET(Fish Transcriptome and Expression Database. http://bioinfo.ihb.ac.cn/fishget)、單細胞轉(zhuǎn)錄組數(shù)據(jù)庫FishSCT(Fish Single-Cell Transcriptome Database, http://bioinfo.ihb.ac.cn/fishsct)和空間轉(zhuǎn)錄組數(shù)據(jù)庫FishSED(Fish Spatial Expression Database, http://bioinfo.ihb.ac.cn/fishsed)。
FishGET收錄了來自于斑馬魚、草魚和虹鱒等8種魚類的97項研究共1362個樣本的RNA-seq雙端數(shù)據(jù)(包括mRNA和lncRNA),進行了轉(zhuǎn)錄本組裝、加權基因共表達網(wǎng)絡分析(WGCNA)、NR/KEGG/GO注釋、臨近位置注釋、lncRNA類型注釋和同源性注釋等工作。網(wǎng)站還提供了多樣化的動態(tài)交互可視化服務,用于查詢和展示魚類不同發(fā)育階段各組織器官內(nèi)的基因表達和共表達網(wǎng)絡等,以期促進魚類基因在轉(zhuǎn)錄水平的相關研究(圖1)。
圖1 FishGET功能模塊
FishSCT收錄了包括斑馬魚等9種魚類的數(shù)據(jù),也是斑馬魚單細胞轉(zhuǎn)錄組數(shù)據(jù)最齊全的在線資源。數(shù)據(jù)庫基于發(fā)表于2022年10月之前的44項研究的129個數(shù)據(jù)集,經(jīng)過統(tǒng)一分析獲得了964個標記基因和26,965個潛在標記基因信息,以及單細胞分辨率下的表達圖譜(細胞數(shù)目:646,641),共涵蓋9種魚類的245種細胞類型。斑馬魚的相關數(shù)據(jù)構成數(shù)據(jù)庫的主體,包括222種細胞類型的848個標記和13,800個潛在標記基因信息,所涉及的組織或器官涵蓋了斑馬魚生長發(fā)育時間線的各個階段(圖2)。FishSCT提供了一個用戶友好的網(wǎng)絡界面,方便用戶瀏覽目標基因的表達模式和標記信息等內(nèi)容(圖3 A-D),并且提供了細胞類型識別的功能(圖3 E-F),來幫助研究人員進行scRNA-seq的相關分析。
圖2 FishSCT數(shù)據(jù)庫中,斑馬魚及其它魚類各組織/器官中細胞類型和標記基因的數(shù)量
圖3 FishSCT數(shù)據(jù)庫的基因表達可視化示例和細胞類型識別功能。A-D,tubb5基因表達模式的可視化與蛋白互作網(wǎng)絡展示;E-F,細胞類型識別功能
FishSED整理了已公開發(fā)表的斑馬魚空間轉(zhuǎn)錄組相關的原始數(shù)據(jù),涵蓋了來自10個項目的56個數(shù)據(jù)集的空間表達譜數(shù)據(jù)(圖4 A)。樣本類型包括所有發(fā)育階段的胚胎和其他幾個組織,經(jīng)過分析和處理后,獲得了涵蓋5種測序技術的3D基因表達圖譜,建立了一個用戶友好、交互性強的斑馬魚空間轉(zhuǎn)錄組數(shù)據(jù)平臺。這是目前唯一的專門收錄斑馬魚空間轉(zhuǎn)錄組數(shù)據(jù)的數(shù)據(jù)庫。FishSED根據(jù)不同的測序技術提供了不同的可視化服務,還可進行跨數(shù)據(jù)集的多基因表達模式搜索與作圖,為研究者進行比較分析提供了方便(圖4 B-G)。
圖4 FishSED數(shù)據(jù)庫的內(nèi)容和可視化結(jié)果示例。A,FishSED數(shù)據(jù)庫的數(shù)據(jù)集分布統(tǒng)計;B-G,不同測序技術的可視化結(jié)果示例
以上數(shù)據(jù)庫的論文發(fā)表在《iScience》和《Science China Life Sciences》,由博士研究生郭成、段攸、葉偉東等人共同完成,夏曉勤研究員和石米娟副研究員為并列通訊作者,點擊可閱讀原文:FishGET, FishSCT, FishSED。本研究得到國家重點研發(fā)計劃“鯉鯽、草魚優(yōu)異種質(zhì)資源鑒定”課題(2021YFD1200804)、“重要養(yǎng)殖魚類基因組選育與單性控制技術”任務(2018YFD0901201),以及中國科學院戰(zhàn)略先導科技專項(XDA24010206)課題“鯉模塊整合育種的生物信息學分析”任務的共同資助。