Bootstrap

基因型与表型的交互作用如何分析,多元回归来搞定

欢迎关注”生信修炼手册”!

回归分析最为关联分析中最长使用的一种手段,除了可以进行协变量的校正,还可以分析各种因素间的交互作用,比如SNP与表型,SNP与环境之间的交互。具体是如何实现的呢?

以线性回归为例,回归方程如下

研究的是因变量y和两个自变量x1,x2之间的线性关系,这样的模型我们称之为相加模型additive model, 该模型假设x1和x2两个自变量是相互独立的,是没有交互作用的。然而在实际情况中,这样的假设不一定成立,很多时候我们需要考虑自变量之间的相互作用。

在回归方程中,通过引入相乘项来表示变量间的交互作用,以上述表达式为例,引入x1和x2的交互作用后,对应的方程如下

这样的模型称之为interaction model,其中x1和x2的相乘项表示两个变量间的交互作用。自变量间的交互作用不局限于两个变量,也可以是多个变量之间,3个变量间交互作用的方程如下

考虑到3个及以上变量交互作用过于复杂,很难解释。在实际分析中,通常只分析两个变量间的交互作用。对应的R语言代码如下

在结果中可以看到 education:prestige对应的p值是显著的,说明二者确实存在了交互作用。 在plink中分析交互作用更加的简单,只需要添加两个参数即可,以逻辑回归为例,用法如下

plink --bfile sample --logistic interaction   --covar phenotype.txt -- --allow-no-sex --ci 0.95 --out out

第一个参数是covar, 协变量的意思,可以将样本对应的表型等信息作为协变量,第二个参数是interaction, 表示分析表型与基因型之间的交互作用。当有多个协变量时,可以再结合parameters参数来指定分析哪些变量间的交互作用。

输出结果示意如下

ADD表示基因型,默认是加性模型,agegender这两个表型作为协变量,和基因型一起作为回归方程中的自变量,而ADDxage和ADDxgender则对应表型与基因型的交互作用。

在多元回归分析中两个变量间的交互作用,可以通过二者的相乘项来表示,应用到关联分析中,可以用于分析基因型与表型之间的交互作用。

·end·

—如果喜欢,快分享给你的朋友们吧—

往期精彩

  基因型填充

  CNV分析

;