如何在NCBI上查找某一基因序列及其启动子

有时研究某一基因需要它的基因序列及其启动子。现在很多已经测序的物种的序列都很容易找到。这里以拟南芥某一基因为例,介绍如何利用NCBI查找这些序列。

操作方法

(01)打开NCBI官网;

如何在NCBI上查找某一基因序列及其启动子

(02)在搜索框中找到“gene”,并输入想要查找的基因号,这里随便搜一个(at1g11110),然后“search”;

(03)在搜索结果中,找到如下图中的“MapViewer”,查看基因在染色体中的位置;

如何在NCBI上查找某一基因序列及其启动子 第2张

(04)下一步的结果就能够查看该基因的位置,还有很多其他的信息,且不管它,找到右上角的“Download/View Sequence/Evidence”,进去下载所需的序列;

如何在NCBI上查找某一基因序列及其启动子 第3张

(05)你可以查看到两种形式的序列:FASTA和GenBank,推荐使用后者,因为可以看到对序列的注释,可以清楚的看到哪是基因,哪是启动子,哪是CDS等。而前者只是纯粹的序列。点击“display”查看;

如何在NCBI上查找某一基因序列及其启动子 第4张

(06)由下图可以看出,该基因序列范围:288..2583,mRNA范围:(288..355,444..467,653..935,1032..1135,1253..1375,                     1641..1803,2052..2583),CDS范围:(444..467,653..935,1032..1135,1253..1375,1641..1803,                     2052..2188)。基因中的外显子不是连续的,因此CDS也不是连续的;

如何在NCBI上查找某一基因序列及其启动子 第5张

(07)CDS上游的序列就是该基因启动子部分,而具体的启动子的长度是不一样的,可以根据需要进行选择。如果觉得上游的序列不够长,可以在右上角设定显示的碱基的范围,从而获得足够长度的序列;

如何在NCBI上查找某一基因序列及其启动子 第6张

(08)希望可以帮到有需要的人。