NCBI是一个非常强大的数据库软件,如何查询基因序列,如何进行引物设计,如何使用BLAST进行序列比对...这些问题在NCBI上都可以很方便的找到答案,但是对于很多新手小白来说却如同天书,不知如何使用。今天小编就跟大家一起简单的认识了解NCBI,学习如何寻找所需基因的信息。
1如何寻找基因信息
首先,打开 NCBI 网页 http://www.ncbi.nlm.nih.gov/ ,选择「gene」,输入您要的基因名称(可简写),如 人胃癌Runx3基因,搜索然后,选择种属,如 homo sapiens,点击进入,http://www.ncbi.nlm.nih.gov/gene/861;
然后,使劲往下拉网页,在"NCBI Reference sequence (Refseq)"下方
NG_011402.2 就是该基因的 genomic DNA 序列号,
NM_001122607.1就是异构体 a 的 mRNA 序列号,而 NP_001116079.1就是 NM_001122607.1相应的氨基酸序列号,
同理,NM_001001890.2 → NP_001001890.1分别是异构体 b 的 mRNA 和氨基酸序列号 NM_001754.4 → NP_001745.2分别是异构体c 的 mRNA 和氨基酸序列号。
点击进入相应页面就会出现详细的外显子、编码序列等信息。
2如何看懂 mRNA 的相关信息
选好 mRNA 序列号后,我们就可以利用其序列设计引物了。
以 Runx3 的异构体 c序列号 NM_001754.4 为例。http://www.ncbi.nlm.nih.gov/nuccore/NM_001754.4 点击进入。
1). source 中/map="21q22.3"是指此基因位于 21 号染色体长臂(q)2 带 2 区 3 亚区;
2). gene 1..5967 表示 Runx3 mRNA 长度 5967bp;
3). "CDS" 为 mRNA 编码氨基酸的序列:
translation="MASDSIFESFPSYPQCFMRECILGMNPSRDVHDASTSRRFTPPSTALSPGKMSEALPLGAPDAGAALAGKLRSGDRSMVEVLADHPGELVRTDSPNFLCSVLPTHWRCNKTLPIAFKVVALGDVPDGTLVTVMAGNDENYSAELRNATAAMKNQVARFNDLRFVGRSGRGKSFTLTITVFTNPPQVATYHRAIKITVDGPREPRRHRQKLDDQTKPGSLSFSERLSELEQLRRTAMRVSPHHPAPTPNPRASLNHSTAFNPQPQSQMQDTRQIQPSPPWSYDQSYQYLGSIASPSVHPATPISPGRASGMTTLSAELSSRLSTAPDLTAFSDPRQFPALPSISDPRMHYPGAFTYSPTPVTSGIGIGMSAMGSATRYHTYLPPPYPGSSQAQGGPFQASSPSYHLYYGASAGSYQFSMVGGERSPPRILPPCTNASTGSALLNPSLPNQSDVVEAEGSHSNSPTNMAPSARLEEAVWRPY" 引号所引就是 Runx3 基因编码的 Runx3 蛋白的氨基酸序列。
"191..1633",191 是编码 mRNA 的起始位置,所以 Runx3 基因(人)编码序列长度是 1633-191+1=1443bp,编码蛋白是由 1443/3=481 个氨基酸构成。
4). exon 是外显子相应的 mRNA 序列。如 exon 249..287 number=1,是指 exon1 对应的 mRNA 位置为 249 到 287,以此类推;
5). ORIGIN 部分就是具体的碱基序列了,可以用来参照设计引物的。
*以上内容最终解释权归本公司所有!
|