以下为《基因家族 课程PPT(1)》的无排版文字预览,完整格式请下载
下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。
基于虚拟机的分析基因家族基因家族
概念:
由具有类似功能的很多基因组成的,这些基因往往具有类似的一个或几个相同的保守结构域。
划分:
按功能划分:把一些功能类似的基因聚类,形成一个家族
按照序列相似程度划分:一般将同源的基因放在一起认为是一个家族
基因家族WRKY 基因家族是植物前十大蛋白质家族之一,大量研究表明, WRKY 基因家族的许多成员参与调控植物的生长发育、形态建成与抗病虫等。
NBS-LRR抗病基因家族: NBS-LRR(nucleotide-binding site and leucine-rich-repeat)是植物中最大类抗病基因家族之一。
MADS-box基因家族是植物体内的重要转录因子,它们广泛地调控着植物生长、发育和生殖等过程。在植物中参与花器官的发育,开花时间的调节,在果实、根、茎、叶的发育中都起着重要的作用。
热激蛋白70家族(HSP70)是一类在植物中高度保守的分子伴侣蛋白,在细胞中协助蛋白质正确折叠。 基因家族参考文献(发表文章)
2016 DNA Research WRKY transcription factor genes in wild rice Oryza nivara
2015 BMC Genomics Identification and distribution of the NBS-LRR gene family in the Cassava genome
2012 BMC Genomics Identification and localisation of the NB-LRR gene family within the potato genome
2016 BMC Genomics Genome-wide investigation and expressionanalyses of the pentatricopeptide repeat protein gene family in foxtail millet
基因家族基因家族分析流程
基因家族利用蛋白保守结构域提取号在Pfam数据库提取其隐马尔科夫模型矩阵文件(*.hmm)
在数据库(Ensemble,JGI,NCBI)下载你所需要的物种的基因组数据(*.fa,*.gff)
安装虚拟机,利用Bio-Linux中的hmmsearch程序,用隐马尔科夫模型矩阵文件在蛋白序列文件中搜索含有该保守结构域的蛋白
基因家族将蛋白序列导入MEGA软件构建进化树
可以阐明成员之间系统进化关系,从进化关系上揭示其多样性
基因家族利用MEME搜索蛋白的保守结构域
利用MEME搜索基因家族中成员的motif可以揭示基因家族在物种内的多样化及其功能,如果它们都含有相同的motif’表明其功能具有相似性,如果部分家族成员含有其他不同的motif,很可能这些成员有其他特异功能,或者可以归分为一个亚族。
例如:MAPK phosphorylation is involved in rice resistance to pathogens. Several WRKYs have been reported to be phosphorylated by MAPKs in tobacco, Arabidopsis and rice.MAPK phosphoryl 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 比值 1,表明这些基因可能已经 受到积极选择,有利于适应性遗传变异,这些受正向选择的基因将作为以后的研究重点。
基因家族绘制基因染色体位置图
*.gff文件包含基因信息,从中抽取我们搜索到的基因位置信息,
http://mg2c.iask.in/mg2c_v2.0/在线绘制基因的染色体位置图
通过染色体位置分布,可以了解基因主要分布在那条染色体上,及是否能形成的基因簇(被认为是通过重组与错配促进基因交流)
基因家族基因家族谢谢![文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《基因家族 课程PPT(1)》的无排版文字预览,完整格式请下载
下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。