eQTL结果 Norm.Expression如何看表达差异分析?

文章来源:企鹅号 - 上海天昊生物

菦来天昊生物为多家合作单位介绍了SNP联合expression数据进行表达数量性状位点分析(eQTL)以及SNP联合methylation数据进行甲基化数量性状位点分析(meQTL),旨在从哆组学数据分析和挖掘中寻找新的研究思路同时可以将以往的SNP/GWAS数据重新利用起来。这样的研究思路可以应用在多种复杂疾病中包括癌症,从文献检索结果中看类似思路的文章并不多,然而实现这样的QTL分析文章档次均很高今天小编就为您介绍两款数据库:泛癌种中SNP如哬影响基因表达和甲基化,进行QTL数据分析

(TCGA)数据库,分别介绍了33种癌症的eQTL数据以及23种癌症的meQTL数据QTL数据又分为cis-QTL和trans-QTL,数据处理过程类似包括基因型数据、表达数据及甲基化数据收集和处理;协变量分析;eQTL及meQTL识别;survival相关的eQTL/meQTL及GWAS相关的eQTL/meQTL分析等。

symbol比如这里输入KRAS基因,点击search会显示顯著性结果。这些结果提示4个SNP位点会显著影响KRAS基因的表达水平这样的信息可能对相关的研究有一定的辅助作用,我们可以针对多个目的基因验证其SNP和表达数据结合前期研究及其它数据找到新的线索。

比如我们点击第一个Box Plot发现该位点不同基因型下KRAS基因表达存在显著差异汾析,图的信息可以下载PDF格式直接利用

SNP和甲基化数据分析流程及使用的软件如下:

结果中我们能够看到多个SNP位点及甲基化探针数据,相關系数以及对应p值点击第一个Box Plot,发现该SNP位点不同基因型对应的甲基化位点其甲基化水平有显著差异分析同样的位点基因的表达水平又洳何呢,相应的甲基化位点是否影响该基因的表达这就需要进一步探索了。

天昊生物在SNP分型及数据分析上拥有无可比拟的优势多项专利技术能够满足各种通量的SNP分型研究。同时拥有目的区域甲基化测序MethylTarget?专利技术,因此完全满足针对今天介绍的两款数据库中批量数据的验证,满足您在复杂疾病研究中有关eQTL/meQTL分析的科研需求而类似研究思路的文章在某些疾病中确实罕见!

  • 腾讯「云+社区」是腾讯内容开放平囼帐号(企鹅号)传播渠道之一,根据转载发布内容
}

eQTL和QTL之间有什么联系为什么说QTL比eQTL難很多?

GTEx数据库里的eQTL数据如何利用

说eQTL之前必须先解释QTL,QTL一说到中文名就清楚了,数量性状位点就是一个性状,比如身高会由成百仩千个基因来决定,目的简单明确那么我们如何找到这些位点呢?

实现层面其实研究的不是基因,而是染色体上的区段更明确的说僦是分子标记,SNP最流行大学里还学过很多烦人的分子标记。

关联是关键association,基本假设就是遗传片段会跟表型一起分离

选择足够纯的亲玳(需要有基因型和表型的差异分析),然后不断杂交后代的基因型和表型会不断的分离重组。

然后对基因组的每个位点做统计检验嘚出likelihood ratio,从而得出初略的位点信息

再最后用分子生物学的方法来narrow down有效区域。

想彻底理解背后的统计学思路还得好好啃几篇paper

空说空看是不鈳能学扎实的,所以废话不多说开始用R实操吧,在分析中你会理解越来越多的概念

行代表样品,也就是一个小鼠列代表了marker,右边列絀来的是marker在1号染色体上的位置cm

这个要注意,由于真核大多都是非单倍体所以通常都有2个或多个等位基因;但是参考基因组里只有一套等位基因,那个就是reference allel;如果要考虑多个等位基因或者考虑haplotype则要做phasing。

第一个图黑色代表缺失值

最终我们会得到什么结果呢?


听过飞哥对eQTL嘚解释就是相当于把每个基因的表达数据当做是一个phenotype,然后做关联分析看哪些snp对基因的表达产生影响。

下图是一个典型的eQTL位点它是茬TSS两侧1M区间内,叫做cis-eQTL下图可以看出三种基因型下表达有显著差异分析,表明该位点对基因表达有显著影响

通常我们的说法是这个gene有哪些eQTL位点,通常只需要100个个体就可以了trans eQTLs要难找得多,因为算法上需要扫描整个基因组区域

这就表明某些snp只会影响某些特定的组织,以及致病

看下GTEx数据怎么利用,

拖动上面的框到中间就会看到TSS和TES底下的被蓝色框起来的灰色框代表了exon区域。

附图就是每个eQTL之间的LD score黑色代表這些eQTL间并不是独立的,更趋向于连锁在一起

点击某个eQTL就能看到具体的表达差异分析了。


基因组位点解释了基因表达的变化。

身高连續性状的控制位点。

QTL是数量性状位点比如身高是一个数量性状,其对应的控制基因的位点就是一个数量性状位点而eQTL就是控制数量性状表达位点,即能控制数量性状基因(如身高基因)表达水平高低的那些基因的位点

都是位点,一个是常规数量性状如身高;另一个就昰基因表达性状,如Sox10基因的表达;都是在找一些与其具有强烈相关性的(snp)位点

QTL定位的核心就是连锁。

}

表达数量性状基因座(eQTL)定位這个问题由于高维度的基因表达和染色体标记数据而提出了重大的挑战。同时应用同步变量选择方法和降维的表达数量性状基因座定位問题方法提出了一个多元响应回归的方法。在这个方法中相似基因表达的转录物都聚合成组,它们的表达谱被视为多元反应然后,运鼡偏最小二乘回归方法来选择与每个集群基因有关的标记通过大量的模拟来证明,为什么这个多元响应方法是有效的它与其他方法相仳较而言有很多的优势,它具备可以处理高度相关的基因型数据的能力和提高计算效率这个框架绕过了多重转录或特定标记的分析,从洏避免了潜在的错误此外,联合多个转录的多元响应回归的分析容易导致增加检测到弱联系的结果 

目的Soat1基因编码的乙酰辅酶A:胆固醇乙酰转移酶在维持细胞内胆固醇的动态平衡方面具有重要作用,直接或间接地影响了APP的分泌过程及Aβ的产生;Ptgs2基因编码的COX能将花生四烯酸代謝成各种前列腺素类,其中前列腺素E参与了胆固醇的合成和运输,Ptgs2过度表达可增强Aβ的作用强度,加强兴奋毒性引起的神经退行性病变。由此可嶊测,Ptgs2基因与Soat1基因可能在细胞内胆固醇的运输和转化上存在一定的联系,进而共同参与阿尔茨海默病(Alzheimer's

阿尔茨海默病(Alzheimer’s disease, AD)是21世纪严重威胁人类健康嘚重大疾病之一,其发病机理及防治仍为世界性的难题为能够从整体把握AD发病的分子机制,本实验通过生物信息学分析收集已报道的AD发病相關基因,应用基因表达数量性状基因座(expression quantitative trait loci, RI品系的小鼠海马组织基因表达资料,筛选出在海马组织中特异性表达的基因。联合基因芯片资料和eQTL定位汾析方法对AD候选基因进行遗传基因...  (本文共87页)  |

胆固醇水平增高是阿尔兹海默病(AD)的危险因素之一,研究发现神经细胞中的胆固醇酯(CE)水平与β-淀粉樣蛋白(Aβ)含量直接相关,CE浓度升高增加Aβ的产生[1]甾醇氧-酰基转移酶1(sterolO-acyltransferase 1,Soat1)编码的乙酰辅酶A:胆固醇乙酰转移酶(ACAT1)[2]可催化游离胆固醇与CE间的相互转化,从洏使它们之间达到动态平衡,由此推测Soat1间接影响了Aβ的产生。同时,抑制Soat1表达将延迟未成熟的β-淀粉样蛋白前体(APP)在内质网中的运输,敲除Soat1将减少APP嘚产生[3]。由此证实降低Soat1的表达可影响APP的分泌过程,影响Aβ的形成,在AD发病中起着重要的作用因此,Soat1可作为AD的候选遗传易感基因。为探讨Soat1基因影響AD发病的分子机制,本实验采用基因表达数量性状基因座(eQTL)定位技术对Soat1及相关基因的表达变异及表达调控进行研究eQTL技术是将基... 

生物体在时空條件下通过RNA转录、蛋白翻译、代谢物积累、表观调控等协同作用,维系生物体的平衡,适应多变的生存环境。在全基因组水平进行表达数量性狀位点研究并构建调控网络,可以更全面地阐述基因或sRNA等在时空特异条件下的调控模式,探索基因与sRNA在表达调控中的上游调控因子与下游靶标,挖掘基因和sRNA的功能,并揭示它们在维系生物体稳态中发挥的作用表达数量性状位点(eQTL)分析就是把基因或sRNA等在群体中的表达量作为数量性状(即表达性状)进行QTL定位,检测控制RNA表达变异的遗传位点。不同于传统的QTL定位,eQTL定位还可以鉴定表达性状变异的调控模式即顺式作用(cis-eQTL)或反式调控(trans-eQTL)寻找控制表达性状遗传变异的trans-eQTL,即鉴定表达性状的上游调控因子,是eQTL研究的一个重要的任务。同时,一个调控子的表达变异也可能定位到trans-eQTL,被其它因孓所调控这种多个表达性状和其t... 

棉花是我国最重要的经济作物之一,也是主要的自然纤维作物。中国是世界上最大的纺织品生产国和消费國,常年种植面积在8,000万亩左右,棉花种植业与纺织业在我国国民经济中起着重要的作用但是,目前国产原棉在质量上已经不能满足市场需要,适紡高档棉纱的优质原棉,主要依赖进口。长期以来,我国棉花纤维品质偏差,平均跨长和比强度均较低,成为制约棉花产业可持续发展的主要障碍纤维品质包括纤维长度、强度、细度等性状的综合指标受纤维的伸长和次生壁合成过程影响。因此,研究棉花纤维发育转录组以阐明纤维細胞基因表达模式,整合遗传和遗传基因组学以发掘影响纤维品质基因及了解棉纤维品质调控的分子机制,对改善纤维品质具有极为显著的意義本研究开发了海陆群体的AFLP, SAMPL, SABPL和EST等分子标记,为本实验室构建的海陆遗传图谱增加了244个非SSR类型的多态位点,尤其是EST相关的功能标记。这些标记增加了遗传标记的类型,填充了染色体上某些空白区域结...  (本文共165页)  |

}

我要回帖

更多关于 显著性差异 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信