-
关于
RefSeq
:
N
CBI
参考序列
N
CBI
的
参考序列计划(
RefSeq
)将为中心法则中自然存在的分子
,从染色体到
mRNA
到蛋白提供参考序列标准。
RefSeq
标准为人类基因组的功能注解提供一
个
基础。它们为突变分析,基因表达研究,和多态发现提供一个稳定的参考点。
范围:目前,
RefSeq
记录为下列分子类型
和基因组提供:
分子
登录格式
基因组
Archaea, Bacterial, Organelle, Virus,
Viroid
原核生物,细菌,细胞器,病毒,疫苗
Eukaryote
真核生物
Plasmid
质粒
Homo sapiens
人类
Limited
Vertebrate
,
Homo sapiens
,
Musmusculus
,
Rattus norvegicus
有限的脊椎动物,人类,小鼠,大鼠。
All of the above
所有以上的
Complete
Genome
NC_######
完整基因组
Complete
Chromosome
完整染色体
Complete
Sequence
完整序列
NC_######
NC_######
NC_######
NC_######
NC_######
Genomic Contig
NT_######
基因组
Contig
NT_######
mRNA
mRNA
Protein
蛋白
NM_######
NM_######
NP_######
NP_######
脊椎动物
mRNA/
蛋白构建步骤:
1 / 10
RefSeq
记录通过以下步骤创建:
确定代表不同基因的序列
建立正确的基因名字到登录号的联系
确定完整范围的可以获得的序列数据
创建一个新的有以下状态的参考序列
(RefSeq)
记录
p>
预测的
临时的
临时的
RefSeq
记录被一个生物学家再检查,
他确定一开始的名
字到序列的关联,
加上一些包括基因功能概要的信息,更重要的是用其他可获得的
GenBank
记录
来更正,重新注解,或扩
充序列数据。预测的,临时的和检查过的
RefSeq
记录
p>
通过
NCBI Entrez
检索系统,<
/p>
BLAST
数据库,
FTP
,和
LocusLink
网站让公众获
得。
最近发表的文章
1. Introducing RefSeq and LocusLink:
curated human genome resources at the NCBI.
Pruitt KD, Katz KS, Sicotte H, Maglott
DR Trends Genet. 2000 Jan;16(1):44-47.
2. NCBI's LocusLink and RefSeq Maglott
DR, Katz KS, Sicotte H, Pruitt KD Nucleic
Acids Res 2000 Jan
1;28(1):126-128
FAQ
什么是参考序列?
NCBI
参考序列计划提供了校正的序列数据和相关的信息,
给同行提供使用的
标
准。
GenBank
是一个序列的存
储池,
RefSeq
数据库将是一个参考序列的非冗余
集
合,
包括构建的基
因组
contig
,
mRNA
,
蛋白,
和,
在未来,
整个染色体。
RefSeq
2 /
10
记录是有三种可以获得的状态:预测的,临时的和检查过的。检
查过的记录代
表了我们目前关于一个基因和它的转录子的知识的
汇编。
在检查的过程中,
我们
整合了更
多的信息,只要是可以获得,如序列数据,发表物,命名,和
特征注
解,都来自于很多
GenBank
记录,人类基因组命名委员会,和
OMIM
。
The initial release of RefSeq
records includes human mRNA and protein reference
sequences. The current scope is limited
to human sequences but other organisms will
be added in the future.
最开始的
RefSeq
记录版本包括人类
mRNA
和蛋白参考序列。
目前的范围只局限
于人类序列,但是其他物种的将在未来加入。
我如何引用
RefSeq
记录?
引用
RefSeq
登录号和
LocusID
以及
RefSeq
网页
(
/LocusLink
/
)是恰当地。特定的使用
Re
fSeq
网页的引用格式依据你文章将发表
的刊物的编辑方法而
定。可以参考这个网站,列出了许多电子文件引用指南:
/I/training
/citation/
。
我如何访问
RefSeq
记录?
< br>
RefSeq
记录可以通过各种
NCBI
资源来访问,包括:
BLAST
NM_######
记录是在核苷酸非冗余数据库中
NP_######
记录是在蛋白非冗余数据库中
Entrez
NM_######
和
NT_######
记录是在
En
trez
核酸中
<
/p>
NP_######
记录是在
Entre
z
蛋白中。
3 / 10
Entrez
基因组部分
NC_######
记录代表完整的基因组,和染色体,完成的和正
在进行的,出现在基因组页面上。
FTP
NM_*
和
NP_*
< br>记录是在
/refseq
目录下;
对人类的
NT_*
记录可以按染色体
数字从
/genbank/genomes/H_sapiens/*
< br>目录下下载,当第一次
的完整版本建立后还将加到
ref
seq
目录下。将来
NC_*
记录
p>
将被加入。参考
FTP
README
文件获得更多的信息。
人类基因组测序
为人类
contigs
的
NT_######
记录只有在人类基因组测序页面上
通过
BLAST<
/p>
查询可以被图形的看到,下载,或访问
LocusLink
LocusLink
记录提供链接到
NM_######
和
NP_######
记录。
LocusLink
可以通过文本条件的
RefSeq
登录
号被查询,
参见
LocusLink
FAQ
取得查询技巧。
通过
Entrez
查询检索
NM_
< br>和
NP_ RefSeq
记录:
RefSeq
记录可以被通过不同的
E
ntrez
查询来检索:
查询结果样本
NM_003988
一个关于
PAX2
,
< br>isoform c
的
RefSeq
< br>记录被
返回。
PAX2[Gene Name]
这返回
17
记录包括
< br>5
个
PAX2
RefSeq
记
录。
PAX2[Gene Name] AND
srcdb_refseq[properties]
这个查询仅检索含有
5
个不同
剪切本的
P
AX2 RefSeq
记录的集合。
srcdb_refseq[prop] AND provisional[all]
这个查询返回所有临时的
RefSeq
记
录集合。
4 / 10
srcdb_refseq[prop] AND
biomol_mRNA[prop] NOT provisional[all]
这个查询返回
所有检查过的
RefSeq
记录集合。
确定在
BLAST<
/p>
结果中的
NM_
和
NP_ RefSeq
记录:
这个
不同的
RefSeq
登录号的格式
(它
们包括一个下划线)
提供一个快捷的指示:
这个
BLAST
结果包括了一个
RefSeq
记录。
Score
E
Sequences producing significant
alignments:
(bits)
Value
ref|NM_000014.1|A2M|
Homo sapiens alpha-2-ma...
9073
^
^
|
|
|
RefSeq
登录号有一个不同的格式
“ref”
表明了
RefSeq
数据库
什么是一个
RefSeq
记录与其他区别的特点?
RefSeq
记录区别与其他
GenBank
记录在:
使用一个特殊的登录号
显示来源信息
,由
RefSeq
打头,在
Comme
nt
字段的第一行
一致的使用可获得的官方命名
包括<
/p>
OMIM
和
LocusLink
dbxrefs
在基因特性中
蛋白记
录指明
RefSeq
作为
DBSOUR
CE
登录号格式
序列类型
NT_123456
构建的基因组
contigs
NM_123456
mRNAs
5 / 10
0.0
-
-
-
-
-
-
-
-
-
上一篇:分子生物学名词解释整理
下一篇:好诗的五个标准