12月21日,國家基因庫生命大數(shù)據(jù)平臺(CNGBdb)與世界數(shù)據(jù)系統(tǒng)(WDS)簽署諒解備忘錄(MOU),成為截至目前WDS在生物信息領(lǐng)域的首個正式會員(Regular Member)。
此前,CNGBdb已通過CoreTrustSeal全球核心可信存儲庫國際認(rèn)證,并獲得Wiley、Oxford、Cell Press、Science系列期刊等多家國際出版機(jī)構(gòu)/期刊認(rèn)可。本次成為WDS的正式會員,CNGBdb將持續(xù)推進(jìn)科學(xué)數(shù)據(jù)國際合作,在保障數(shù)據(jù)安全的前提下,推動科學(xué)數(shù)據(jù)開放共享,激發(fā)科學(xué)數(shù)據(jù)融合應(yīng)用價值。
世界數(shù)據(jù)系統(tǒng)(WDS)是國際科學(xué)理事會在2008年第29屆大會上成立的跨學(xué)科組織,其前身是1957年成立的世界數(shù)據(jù)中心(World Data Center,WDC)。WDS的使命是支撐國際科學(xué)理事會的長期愿景,在自然科學(xué)、社會科學(xué)和人文科學(xué)等一系列學(xué)科之間,為科學(xué)數(shù)據(jù)、數(shù)據(jù)服務(wù)、產(chǎn)品和信息提供有質(zhì)量保證的長期管理和平等訪問,促進(jìn)遵守相互協(xié)定的數(shù)據(jù)標(biāo)準(zhǔn)和實踐,提供促進(jìn)和改進(jìn)數(shù)據(jù)訪問的機(jī)制,并采用“數(shù)據(jù)共享原則”推進(jìn)其目標(biāo)。
作為服務(wù)于國家戰(zhàn)略的重大科技基礎(chǔ)設(shè)施之一,深圳國家基因庫已建成千萬級樣本存儲能力、691萬億次/秒計算能力、Pb級數(shù)據(jù)產(chǎn)出能力,并在此基礎(chǔ)上建立了綜合性生命科學(xué)數(shù)據(jù)共享平臺——國家基因庫生命大數(shù)據(jù)平臺(CNGBdb),為全球科研工作者提供生物大數(shù)據(jù)匯交管理和共享服務(wù)。
上圖為國家基因庫生命大數(shù)據(jù)平臺(CNGBdb)
CNGBdb一直致力于穩(wěn)定、可靠、持續(xù)的科學(xué)數(shù)據(jù)存儲庫建設(shè),并推動科學(xué)數(shù)據(jù)的安全共享。目前CNGBdb已通過CoreTrustSeal全球核心可信存儲庫、FAIRsharing國際認(rèn)證及國際科研數(shù)據(jù)倉儲目錄re3data收錄,支持Elsevier、Wiley、Taylor & Francis、Oxford、Cell Press、Science等多個國際著名出版社/系列期刊投稿發(fā)文,交到CNGBdb的數(shù)據(jù)統(tǒng)一進(jìn)行DOI(數(shù)字對象標(biāo)識符)標(biāo)識。
CNGBdb的存儲功能由國家基因庫序列歸檔系統(tǒng)(CNSA)負(fù)責(zé)。CNSA是一個支撐全球組學(xué)研究成果匯交和管理的系統(tǒng),致力于多組學(xué)數(shù)據(jù)(基因組、轉(zhuǎn)錄組、代謝組、單細(xì)胞和空間轉(zhuǎn)錄組等)的開放和共享,為全球科研人員提供更加安全、穩(wěn)定、可靠、便捷的數(shù)據(jù)歸檔服務(wù),促進(jìn)多組學(xué)數(shù)據(jù)的再利用,推動全球生命科學(xué)的發(fā)展。
上圖為國家基因庫序列歸檔系統(tǒng)(CNSA)
截至目前,CNSA已歸檔多組學(xué)數(shù)據(jù)13108TB,支撐全球502個科研單位的科研數(shù)據(jù)匯交和共享,支持論文發(fā)表1370篇,發(fā)表期刊369種,包括The Lancet、Science、Cell等。
未來,CNGBdb將以國家政策法規(guī)為導(dǎo)向,以數(shù)據(jù)安全為基本點,持續(xù)提升數(shù)據(jù)資源建設(shè)和數(shù)據(jù)應(yīng)用服務(wù)力,為全球科研工作者提供更優(yōu)質(zhì)、可靠的科學(xué)數(shù)據(jù)服務(wù)。
相關(guān)稿件