数据管理与分析平台
数据管理与分析平台旨在建立“汇-通-管-用-评”五位一体的标准化大数据信息平台。汇聚生物样本库数据、流行病学数据、基因数据、临床数据、生物标志物数据等异构数据。通过统一标准、深度治理等实现数据治理融合贯通,并对全量数据资产进行标准化、标签化管理,通过数据智能应用服务支撑数据开发、算法开发等各类科研项目,通过数据权限分级,服务于业务人员、运维人员、数据管理员和科研团队等不同用户角色,探索和推动共享平台建设。并通过数据汇聚评估、数据质量评估和数据使用评估提升大数据信息平台的质量。
目前已搭建三组数据分析计算专用高性能服务器集群(分别在浙大紫金港校区、浙大二院及医学中心)。服务器存储量在1PB以上,且后期根据使用需求可继续扩容升级,采用双冗余控制系统,数据备份系统及UPS不间断电源,具备优良的计算及容灾性能。并建设了基于210多万人次、总体检人数超过100万的体检数据的健康体检大数据平台。中心旨在建立全基因突变、转录、蛋白、代谢、免疫和TCR表型图谱,利用深度学习模型,并运用单生命组学分析或多生命组学联合分析方法,发现与慢性病发生发展以及吸烟成瘾性、老年认知、运动、睡眠、饮食等相关的易感基因、代谢、免疫以及TCR表型等关键生物标志物及跨尺度生物通路。