欢迎关注”生信修炼手册”!
回归分析最为关联分析中最长使用的一种手段,除了可以进行协变量的校正,还可以分析各种因素间的交互作用,比如SNP与表型,SNP与环境之间的交互。具体是如何实现的呢?
以线性回归为例,回归方程如下
研究的是因变量y和两个自变量x1,x2之间的线性关系,这样的模型我们称之为相加模型additive model
, 该模型假设x1和x2两个自变量是相互独立的,是没有交互作用的。然而在实际情况中,这样的假设不一定成立,很多时候我们需要考虑自变量之间的相互作用。
在回归方程中,通过引入相乘项来表示变量间的交互作用,以上述表达式为例,引入x1和x2的交互作用后,对应的方程如下
这样的模型称之为interaction model,其中x1和x2的相乘项表示两个变量间的交互作用。自变量间的交互作用不局限于两个变量,也可以是多个变量之间,3个变量间交互作用的方程如下
考虑到3个及以上变量交互作用过于复杂,很难解释。在实际分析中,通常只分析两个变量间的交互作用。对应的R语言代码如下
在结果中可以看到 education:prestige对应的p值是显著的,说明二者确实存在了交互作用。 在plink中分析交互作用更加的简单,只需要添加两个参数即可,以逻辑回归为例,用法如下
plink --bfile sample --logistic interaction --covar phenotype.txt -- --allow-no-sex --ci 0.95 --out out
第一个参数是covar
, 协变量的意思,可以将样本对应的表型等信息作为协变量,第二个参数是interaction
, 表示分析表型与基因型之间的交互作用。当有多个协变量时,可以再结合parameters参数来指定分析哪些变量间的交互作用。
输出结果示意如下
ADD
表示基因型,默认是加性模型,age
和gender
这两个表型作为协变量,和基因型一起作为回归方程中的自变量,而ADDxage和ADDxgender则对应表型与基因型的交互作用。
在多元回归分析中两个变量间的交互作用,可以通过二者的相乘项来表示,应用到关联分析中,可以用于分析基因型与表型之间的交互作用。
·end·
—如果喜欢,快分享给你的朋友们吧—
往期精彩
基因型填充
CNV分析