更新时间:2016-05-12 10:53 浏览: 次 作者:admin
芯片分析的大体思路可以从以下几个方面考虑:
我们最熟悉的应该是聚类分析结果,这类结果通常以热图的形式展现:
但这对我们来说是远远不够的,为了进行更加深入的分析,我们会对芯片数据进行预处理,包括对实验数据质量评估,预处理及均一化处理等等。提供一份包含检测结果的表格:
芯片分析的结果包括lncRNA和mRNA,分别做差异表达lncRNA和mRNA基因的筛选。再根据这份初步的数据,对差异表达lncRNA及mRNA 的筛选:根据客户提供样本量的大小与分布或实验目的,应用倍数法、多重假设检验等手段,对两条件或多条件下的表达差异的lncRNA和mRNA分别进行计算和筛选。实现以下三种分析结果:
(1)表达模式聚类分析:针对芯片结果进行样本及差异表达lncRNA和mRNA的聚类,寻找属于同一表达趋势的基因或样本。
(2) GO和pathway显著性富集分析:差异基因,应用数据库进行功能富集分析,挖掘具有统计学意义的差异表达基因的功能类别。显著性P值越小,则它随机聚集差异表达基因的概率越小,其功能相关性的非随机性就越小,该功能模块有较大的可能与疾病(或药物作用)相关。
(3)蛋白互作网络分析:研究与指定蛋白质相互作用的其他蛋白质的信息,以使研究人员能够更加深入地认清相关蛋白质的功能,更清楚地理解其调控机制。
由此,呈现给大家的数据将会有以下几种类型:
差异lncRNA的重注释
lncRNA芯片注释不完善,需要将筛选出来的lncRNA进行重注释。同时会对芯片所检测的mRNA信息进行注释。
lncRNA作用机制的分析
(1)lncRNA cis作用机制研究:对于感兴趣的差异表达lncRNAs,搜索其上下游100K范围内的所有编码基因,这些在基因组上临近、且表达模式上共表达的基因很可能被该lncRNAs 所调控。
(2)lncRNA trans作用机制研究:计算LncRNAs 共表达的编码基因,集合与转录因子/染色质调控复合物的靶基因集合的交集,利用超几何分布计算该交集的富集程度,得到与lncRNAs 显著相关的转录因子,从而识别可能与lncRNAs 联合发挥调控作用的转录因子/染色质调控因子。
lncRNA的靶基因预测和功能预测
lncRNA可能通过调控相应的mRNA发挥功能,因此有必要预测lncRNA的靶基因。提取差异lncRNA和mRNA的序列,首先用blast进行初筛,之后用RNAplex进行进一步筛选,并与该lncRNAs 有显著共表达的基因取交集,以预测lncRNA可能调控的mRNA。利用成熟的mRNA的功能来推导lncRNA 的功能,对异常表达lncRNA 显著相关的mRNA 进行功能富集分析。
差异表达mRNA功能分析
GO数据库包含了基因参与的生物过程,所处的细胞位置,发挥的分子功能三方面功能信息,并将概念粗细不同的功能概念组织成DAG(有向无环图)的结构。Gene Ontology是一个使用有控制的词汇表和严格定义的概念关系,以有向无环图的形式统一表示各物种的基因功能分类体系,从而较全面地概括了基因的功能信息,纠正了传统功能分类体系中常见的维度混淆问题。在基因表达谱分析中,GO常用于提供基因功能分类标签和基因功能研究的背景知识。利用GO的知识体系和结构特点,旨在发掘与基因差异表达现象关联的单个特征基因功能类或多个特征功能类的组合。
把差异的基因向 gene ontology 数据库的各节点映射。并根据统计检验方法(P-value)筛选显著富集的分类,所用方法为david(http://david.abcc.ncifcrf.gov/)。取p值<=0.05为最后输出结果。结果常分生物过程(BP),分子功能(MF),细胞组件(CC)三部分。
差异表达基因通路分析
差异的基因分别向KEGG pathway数据库映射,用软件DAVID进行信号通路分析,得到差异表达lncRNA所涉及的生物途径。
差异lncRNA与靶基因共表达网络
预测出lncRNA的靶基因后,并可进一步在mRNA的数据中探寻该mRNA是否发生表达量的变化。由此构建差异lncRNA与靶基因相互作用网络图。
差异lncRNA与靶基因相互作用网络图。圆形代表lncRNA,三角形代表mRNA,红色为上调表达,绿色为下调表达。连线表示可能的调控关系,连线越多,表示调控的mRNA越多,预示该lncRNA在调控网络中所起的作用可能越大。
差异lncRNA与差异mRNA的共表达分析
Human lncRNA芯片能同时检测出差异表达的lncRNA和mRNA。将差异lncRNA和差异mRNA在一组样品中进行共表达分析,可以发现与某个lncRNA具有相同表达模式的mRNA。
lncRNA与mRNA共表达分析作用图,描边圆代表lncRNA,未描边圆代表mRNA。红色为上调基因,绿色为下调基因。
差异lncRNA的转录因子的预测
提取lncRNA TSS的上游2000bp,下游500bp。利用HMM的算法根据TRANSFAC8.1数据库预测其转录因子。
选择lncRNA芯片检测,按照我们的要求,公司会将以上众多数据分析呈现给我们。我们需要明白这些数据所代表的意义,并能在复杂的数据中获得我们想要的信息。
以上是为您总结的lncRNA芯片数据分析思路与方法,希望对您的科研工作有所帮助,感谢您一如既往的支持。
上一篇:没有了