中國BIGD躋身國際生物組學數據庫

-回復 -瀏覽
樓主 2019-06-29 23:42:46
舉報 只看此人 收藏本貼 樓主

測序技術的發展將生命科學領域帶入組學時代,海量的數據產出成為常態。組學是將基因、蛋白及代謝物等生物分子以整體為單位進行系統性的研究,基因組學、蛋白質組學和代謝物組學等相應產生。相較于此前以個體為單位的研究,組學最主要的特征就是大數據。隨著組學數據的產出,搭建組學數據庫,實現海量信息的存儲、整合及共享,成為一項重要任務。

目前,在國際上被認可的生物組學數據中心主要有美國的NCBI、歐洲的EBI及日本的DDBJ。要想在國際期刊發表論文,需要先將自己的原始數據提交到這三個官方指定的數據庫中。這種情況表面上有利于國際科學數據的資源整合與共享,實際上卻對中國的科學研究發展帶來了很大的影響:這不僅影響了數據提交時的效率,更重要的是在數據下載時還會遇到各種限制,中國的科學家始終不能做自己數據的主人。

中國的生物組學數據產量約占全球的40%,是數據產出大國,卻沒有一個能夠被國際認可的數據庫系統,不得不將自己寶貴的數據資源交給他人代管。

現在,這種情況終于得到改變。近日,中國科學院北京基因組研究所生命與健康大數據中心團隊在國際學術期刊《核酸研究》在線發表了一篇研究論文,題目為“北京基因組研究所生命與健康大數據中心:從存儲到整合再到轉化”。生命與健康大數據中心章張研究員、趙文明高級工程師以及肖景發研究員為本文共同通訊作者。這是我國第一次以數據中心的模式,整體發布我國生命組學數據資源的建設情況,標志著生命與健康大數據中心的建設取得了實質性進展,也標志著我國建設綜合性基因組數據資源獲得國際同行認可。


北京基因組研究所生命與健康大數據中心(Beijing Institute of Genomics Data Center)簡稱BIGD,肩負著建成面向國家大數據發展戰略的多層次生物組學數據資源系統的重要歷史使命。目前的數據資源系統包括:高通量測序的原始組學數據歸檔庫GSA,圍繞國家重要戰略生物資源的基因組數據庫GWH,基于測序數據的基因表達數據庫GEN,基于中國人群以及國家重要物種群體的基因組變異數據庫GVM,基于全基因組DNA甲基化圖譜的表觀基因組數據庫MethBank,以及基于大眾審編的生命科學維基知識庫Science Wikis等,初步形成了我國生命與健康數據交會與共享平臺,具備可服務于全球的基因組數據共享網絡。該研究得到中國科學院戰略性先導科技專項、中國科學院國際大科學計劃等項目基金的資助。

現在,包括美國國家科學院院刊、細胞研究等核心期刊在內的多個國際核心期刊已經認可把數據提交到BIGD,中國原始組學數據庫BIGD成為繼國際三大數據中心之后,國際上第四個被認可的數據庫。

(來源:科技日報)

更多詳情請點擊左下角“閱讀原文”

我要推薦
轉發到
吉林快3和值走势一定牛