打印 基因家族分析套路 (1) 人人文库0602

本文由用户“dqszbls”分享发布 更新时间:2021-06-25 04:44:08 举报文档

以下为《打印 基因家族分析套路 (1) 人人文库0602》的无排版文字预览,完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

基因家族分析套路(一)

近年来,测序价格的下降,导致越来越多的基因组完成了测序,在数据库中形成了大量的可用资源。如何利用这些资源呢?今天小编带你认识一下不测序也能发文章的思路--全基因组基因家族成员鉴定与分析(现在这一领域可是很热奥);

一、基本分析内容

数据库检索与成员鉴定

进化树构建

保守domain和motif分析.

基因结构分析.

转录组或荧光定量表达分析.

二、数据库检索与成员鉴定

1、数据库检索

1)首先了解数据库用法,学会下载你要分析物种的基因组相关数据。一般也就是下面这些数据库了

Brachypodiumdb:

TAIR:

Rice?Genome?Annotation?Project?:.

Phytozome:

Ensemble:?

NCBI基因组数据库:

2)已鉴定的家族成员获取。

? ? ??如何获得其他物种已发表某个基因家族的所有成员呢,最简单的就是下载该物种蛋白序列文件(可以从上述数据库中下载),然后按照文章中的ID,找到对应成员。对于没有全基因组鉴定的,可以下列数据库中找:

???a.?NCBI:?nucleotide?and?protein?db.

?????b.?EBI:?.

?????c.?UniProtKB:

2、比对工具。一般使用blast和hmmer,具体使用命令如下:

Local?BLAST

formatdb–i?db.fas–p?F/T;

blastall–p?blastp(orelse)?–i?known.fas–d?db.fas–m?8?–b?2(or?else)?e?1e-5?–o?alignresult.txt.

-b:output?two?different?members?in?subject?sequences?(db).

Hmmer?(hidden?Markov?Model)?search.?Thesame?as?PSI-BLAST?in?function.?It?has?a?higher?sensitivity,?but?the?speed?islower.

Command:

hmmbuild--informatafaknown.hmmalignknown.fa;?

?hmmsearchknown.hmmdb.fas>align.out.

3、过滤。

Identity:?至少50%.

Cover?region:?也要超过50%或者蛋白结构域的长度.

domain:?必须要有完整的该蛋白家族的。工具pfamdb?()?和NCBI?Batch?CD-?search.?().

EST?支持

?Blast?and?Hmmer同时检测到

4、通过上述操作获得某家族的所有成员

基因家族分析套路(二)

本次主要讲解在基因家族分析类文章中,进化部分分析的内容。主要是进化树的构建与分析。

一、构建进化树的基本步骤

1、多序列比对.?Muscle?program.

2、Model?选择.?分别针对蛋白序列和核酸序列的模型选择程序。ProtTest?program?for?protein?and?ModelTest?or?Jmodetlest?for?DNA().

3、算法选择。三种.?NJ,?ML?and?BI.

4、软件选择。?MEGA?(bootstrap?least?1000?replicates),?phyML?and?Mrbayes?().

5、进化树修饰.?MEGA:?view->options?and?subtree->?draw?options.?Also?can?be?decorated? 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 d_hits.bam

???samtools?view?-h?-o?output-uniq.sam?output_uniq.bam

excel?for?calculation(low?frequencyreads?≤5?were?omitted?).

3)差异表达的基因。

?寻找存在差异表达的家族成员,推测其可能的功能。有下面两种分析策略,均可采用。

a.倍数法。对于基因家族分析,可以采用倍数法,以2倍为标准,得到上调和小的基因

b.CV值。计算某个成员在不同处理下的基因表达变化。CV?=SD/mean.Used?in?differenttissues?or?organs?anlysis.

[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。

  1. Compression strength of stainless steel cross-sect
  2. 165个英语考试写作好句型,接本考生必须掌握
  3. 问题四:研究生期间的规划
  4. Notes-on-the-Text教案
  5. 英语作文写作模板
  6. 英语期末复习答案
  7. 新冠疫情对全球经济有什么影响呢?解读
  8. 衡中同卷知识点
  9. Challenge to All演讲稿
  10. 工业互联与5G
  11. 四级词汇摘抄
  12. 4425
  13. 专四语法真题集

以上为《打印 基因家族分析套路 (1) 人人文库0602》的无排版文字预览,完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

图片预览