研究亮点

周丹研究员在Nature Genetics发文报道转录组关联分析的方法创新和应用

来源:浙江大学健康医疗大数据国家研究院 发布时间:2020-11-12 作者: 阅读次数:177

2020105日,周丹研究员在自然遗传杂志上在线发表题为“A unified framework for joint-tissue transcriptome-wide association and Mendelian randomization analysis” 的遗传流行病学方法学论文,创新优化了转录组关联分析。

近些年,以PrediXcan为代表的转录组关联分析 (Transcriptome-wide association study, TWAS) 被广泛地应用在寻找复杂表型关联基因的遗传流行病学研究中。与基因组关联分析 (Genome-wide association study, GWAS) 相比,TWAS以转录调控作为遗传变异与表型之间的中介,将单个遗传变异与表型的关联转换成基因/转录本与表型的关联。TWAS的研究过程主要可以分成两个步骤第一,利用基因附近(cis)的遗传变异信息构建转录水平预测模型;第二,利用模型预测研究对象的基因表达水平,并与表型做关联分析。该研究策略的优势包括:(1) 相比SNP,以基因为单位的分析具有更低的多重比较次数(2) 结果以基因的形式呈现,其生物学意义更为直接,便于后续功能研究及成果转化;(3) 相比转录组单组学研究,以胚系基因组遗传变异为基础的转录组研究不会出现因果倒置的问题,且受混杂因素的影响较小; (4) GTEx数据库已提供了极为丰富的基因组、转录组数据,研究者可利用多达49种人体组织、细胞的资料作为参照建立模型,无需额外的样本检测即可实现从GWASTWAS的跃迁。虽然TWAS获得广泛的认可,但该研究方法仍然存在改进的空间。

新方法MR-JTI在两个方面对TWAS进行了创新优化:第一,通过提高模型的预测精度增加关联分析的检验效能(power);第二,解决横向基因多效性(horizontal pleiotropy) 及潜在混杂因素带来的假阳性问题。该工作针对难点问题建立了多组织联合预测的研究方法JTI(Joint-Tissue Imputation)和基于孟德尔随机化框架的MR-JTI方法,并开发了应用软件。该方法通过借助相似组织的信息提升模型的预测精度以增加检验效能。受组织转录调控相似性的启发,原创性地融合了ENCODE等数据库中启动子区域染色质可及性和转录图谱信息,解决了如何系统化地借助组织、细胞间转录调控的相似性规律,增加基因表达预测精度的关键科学问题。交叉验证结果显示,预测精度平均提升了60.3%。同时,为解决研究中可能存在的由横向基因多效性引起的假阳性问题,创新性地将可能存在的横向基因多效性纳入模型,并通过threshold bootstrap LASSO的方法巧妙地解决了如何将工具变量的横向与纵向基因多效性分离,得到近似无偏估计值,提升因果证据强度的关键科学问题。

该工作提供了所有基于20209月最新发布的包含人体49种组织细胞的GTEx v8基因表达数据预测模型以供下载应用。模型以.db的格式给出,与PrediXcan相一致。同时给出的还有SNP-SNP的协方差矩阵,以便熟悉S-PrediXcan的读者将最新的模型无缝地衔接到关联分析中去。

该工作整合了包括基因组(GTEx)、转录组 (GTEx)、表观修饰组 (ENCODE, Roadmap)的信息,利用多个大型数据库 (PsychENCODE, GEUVADIS, UK Biobank, BioVU),不仅优化了转录组关联分析的策略,还提供了最新的数据资源以便读者使用,为复杂疾病的遗传流行病学研究提供了新的思路和资源。

原文链接:

https://www.nature.com/articles/s41588-020-0706-2