hardship什么意思-光景近义词
精品文档
GenBank 中字符的意思
Nucleotide
数据库分为三个子数据库:
· EST
表:达序列标记数据库
· GSS 基:因组测序序列数据库
·
CoreNucleotide : 包含所有未被以上两个子数据库收录的核苷酸序列
MeSH:
查询缩写基因的全称
●
3、 RefSeq(Reference
Sequence)序列接受号
:
( 1) mRNA 记录(
NM_* ) :
e.g.:NM_000492
(2)基因组的
DNA 重叠群( NT_* ) :
e.g.:NT_000347
(3)完整的基因组或染色体(
e.g.:NC_000907
(4)基因组的局部区域(
e.g.:NG_000019
(5)从人类基因组注释、加工得到的序列模型(
e.g.:XM_000483
GenBank
记录中特性表中的主要关键词
解 释
生物学特性无法用特性
表关键词描述的序列
序列特性无法用特性表
关键词描述的序列
同一序列在不同的研究
中在位点或区域上有差
异
序列不能确定的区域
该序列对以前的版本做
过修订
包含稳定突变的序列
修饰过的核苷酸
已识别为基因或已命名
的序列区域
无法用信号特性关键词
描述的信号序列
NC_*) :
NG_*) :
XM, XP,
or XR_* ):
●
:
关键词
promoter
关键词
misc_feature
解 释
转录起始区
misc_difference
CAAT_signal
TATA_signal
真核启动子上游的 CAAT
盒 ,与 RNA 结合相关
真核启动子的
TATA盒
conflict
unsure
old_sequence
-35_signal
-10_signal
原核启动子中的 -35 框
原核启动子的
Pribow 盒
variation
modified_base
gene
GC_signal
RBS
polyA_signal
enhancer
真核启动子的
GC盒
核糖体结合位点
RNA 转录本的剪切识别
位点
增强子
misc_signal
.
精品文档
关键词
attenuator
terminator
rep_origin
misc_RNA
解 释
与转录终止有关的序列
转录终止序列
双链 DNA
复制起始区
无法用 RNA 关键词描述的
转录物或 RNA
产物
初始转录本
前体 RNA
关键词
CDS
sig_peptide
transit_peptide
mat_peptide
intron
polyA_site
rRNA
tRNA
解 释
蛋白质编码序列
编码信号肽的序列
转运蛋白编码序列
编码成熟肽的序列
prim_transcript
precursor_RNA
内含子
RNA 转录本的多聚腺苷
酸化位点
核糖体 RNA
转运 RNA
mRNA
5’ clip
信使 RNA
前体转录本中被剪切掉的
5’端序列
前体转录本中被剪切掉的
3’端序列
5’非翻译区
3’非翻译区
外显子
3’
clip
scRNA
小细胞质 RNA
5’ UTR
3’ UTR
snRNA
snoRNA
小核 RNA
加工和修饰
核 RNA
rRNA 的小
exon
关键词
immunoglobulin_related
C_region
D_segment
解 释
关键词
repeat_unit
解 释
单个的重复元件
长末端重复序列
卫星重复序列
免疫相关蛋白上的不变区
区,
T
细胞受体β链
免疫球蛋白重链、轻链以
及 T
细胞α、β、γ的结
合链
插入重排免疫球蛋白片段
间的核苷酸
免疫球蛋白重链的开关区
编码免疫球蛋白的可变区
N 末端的序列
编码免疫球蛋白的可变区
的序列
基因组中所包含的重复序
列
无法用结构关键词描述的
核酸序列高级结构或构型
LTR
免 疫 球 蛋 白重 链 的 可 变
Satellite
J_ segment
misc_binding
无法描述的核酸序列
结合位点
N_ region
primer_bind
复制、转录的引物结
合位点
蛋白质结合区
测序标签位点
S_ region
V_ region
protein_bind
STS
misc_recomb
iDNA
stem_loop
V_ segment
无法用重组特性关键
词描述的重组事件
通 过 重 组 所 消 除 的
DNA
发夹结构
线粒体中 DNA 中的取
代环
repeat_region
misc_structure
D_loop
.
精品文档
◆
GenBank 记录中特性表中的限定词
:
限定词
allele=
含
义
限定词
含 义
相对于序列第一个碱
基,编码序列密码子的
偏移量
给 定 基 因 的 等 位
基
codon_start=
因
bound_moiety=
cell_type=
嵌合范围
country=
DNA 样本的来源国
其他数据库信息的交
叉索引号
DNA 复制方向
获 得 序 列 的 细 胞 类
db_xref=
型
已 被 引 用 的 参 考 文
direction=
献数
获 得 序 列 的 克
隆 文
environmental_sample=
库
citation=
clone_lib=
序列直接从环境材料
中获得而没有指明来
源物种
限定词
exception=
含 义
限定词
PCR_conditi-
ons=
含 义
描述
PCR的反应条件
指明 DNA 序列未按通常的
生物学规律翻译,如
编辑
RNA
frequency=
在种群中发生变异的频率
pop_variant=
product=
获得序列的群体变异种
名称
序列编码产物的名称
germline
如果序列是 DNA 并来源于
免疫球蛋白家族, 则表示该
序列来源于未重排
DNA
insertion_seq=
序列来源于某种插入元件
anticodon=
cell_line=
chromosome=
tRNA 反义密码子的位置
及它所编码的氨基酸
获得序列的细胞系
获得序列的染色体
获得序列的克隆子
isolate=
lab_host=
序列来源的生物个体
为扩增序列来源物种所用
的实验室宿主
macronuclear
指明 DNA 来源于染色体分
化的大核期
评论及附加信息
clone=
note=
codon=
指出与参考密码子不同
的密码子
序列产物的酶学编号
描述在翻译中与通用密
码表不同的密码表
表明该特性在其他检索
中也被使用
病毒颗粒
organelle=
sub_strain=
获得序列的细胞器
种
获得序列组织类型
EC_number=
transl_table=
获得序列的来源微生物亚
tissue_type=
usedin=
virion
translation=
按通用或指定的密码子表
翻译的氨基酸序列
.
精品文档
限定词
cons_splice=
含 义
限定词
含 义
相关特性在基因图谱上的
位置
被修饰碱基的简写
从 5’→
3’注明遗传元件的
顺序
提供测序用遗传物质的物
种的科学名称
序列特性所导致的表型
区
分 内 含 子 剪 切 位点 和
map=
“
5-GT‘.AG-3' ”剪切位点
所获序列植物的栽培变种
序列来源于某种生物的特
定发育阶段
序列特性来源于实验还是
推理
指出在记录中的来源特性
在其他物种中还有不同的
来源特性
序列所代表的功能
序列来源于某种物种的单
倍体
理、环境和地理信息
序列特性的俗名
cultivar=
dev_stage=
mod_base=
number=
organism=
evidence=
focus
phenotype=
function=
haplotype=
plasmid=
protein_id=
获得序列的质粒名称
蛋白质的检索号
整合在基因组中的前病毒
isolation_sou-
rce=
描 述 序 列 来 源 物 种的 生
proviral
label=
rearranged
如果序列是 DNA
并来源于
免疫球蛋白家族, 则表示该
序列来源于重排
DNA
限定词
rpt_family=
rpt_unit=
含 义
重复序列
指明重复区域的重复元件
构成
同一物种的不同血清学特
征
获得序列的物种性别
限定词
transposon=
variety=
pseudo
含 义
转座子
获得序列的生物变
种
假基因
表明特性间的间隔
序列已被替换
重复序列的组织方
式
获得序列的分子类
型
同一原核生物的血
清学特征
获得序列的天然宿
主
特性的通用名称
serotype=
sex=
replace=
rpt_type=
specimen_vou-cher=
指明来源物种保存于什么
地方
获得序列的菌珠
strain=
sequenced_m-ol=
serovar=
sub_species=
获得序列的来源物种的亚
种
获得序列组织库
tissue_lib=
specific_host=
standard-name=
transgenic
指明物种的来源特性是否
是转基因受体
标明序列中未按指定密码
子表翻译的氨基酸的位置
transl_except=
sub_clone=
获得序列的亚克隆
.
精品文档
◆ BLAST
1. blastn (nucleotide blast)
是核酸序列到核酸库中的一种查询。库中存在的每条已知序
列都将同所查序列作一对一地核酸序列比对。
2. blastp (protein blast) 是蛋白序列到蛋白库中的一种查询。库中存在
的每条已知序列
将逐一地同每条所查序列作一对一的序列比对。
3. blastx 是核酸
序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核
酸序列会被翻译成可能的六条蛋白)
,再对每一条作一对一的蛋白序列比对。
4. tblastn
是蛋白序列到核酸库中的一种查询。与
blastx 相反,它是将库中的核酸序列
翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。
5. tblastx
是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核
酸序列都翻译成蛋白(每条核酸序列会产生
会产生 36 种比对阵列。
6 条可能的蛋白序列) ,这样每次比对
Accession
AC_123456
Molecule
Genomic
Method
Mixed
AP_123456
Protein
Mixed
NC_123456
Genomic
Mixed
NG_123456
Genomic
Mixed
NM_123456
NM_123456789
.
mRNA
Mixed
Note
Alternate complete genomic
molecule.
This prefix is used
for records that
are provided to
reflect an alternate
assembly
or annotation. Primarily used
for viral, prokaryotic
records.
Protein products; alternate
protein
record. This prefix is
used for records
that are
provided to reflect an
alternate assembly or
annotation. The AP_ prefix was
originally designated for
bacterial proteins but this
usage
was changed.
Complete genomic
molecules
including genomes,
chromosomes, organelles,
plasmids.
Incomplete genomic region;
supplied to support the NCBI
genome
annotation pipeline.
Represents either
non-transcribed pseudogenes,
or
larger regions representing
a gene cluster
that is
difficult
to annotate via
automatic
methods.
Transcript
products; mature
messenger RNA (mRNA)
精品文档
NP_123456
NP_123456789
Protein
Mixed
NR_123456
RNA
Mixed
NT_123456
Genomic
Automated
NW_123456
NW_123456789
Genomic
Automated
NZ_ABCD12345678Genomic
Automated
XM_123456
XM_123456789
mRNA
Automated
XP_123456
XP_123456789
Protein
Automated
XR_123456
RNA
Automated
YP_123456
YP_123456789
Protein
Mixed
ZP_12345678
Protein
Automated
transcripts.
Protein products;
primarily
full-length precursor
products
but may include some partial
proteins and mature peptide
products.
Non-coding
transcripts
including structural
RNAs,
transcribed pseudogenes, and
others.
Intermediate genomic
assemblies of BAC andor Whole
Genome Shotgun sequence data.
Intermediate genomic
assemblies
of BAC or Whole
Genome Shotgun sequence
data.
A collection of whole genome
shotgun sequence data for a
project.
Accessions are not
tracked between
releases. The
first
four
characters
following
the
underscore (e.g. 'ABCD')
identifies a
genome project.
Transcript
products;
model mRNA
provided
by a genomeannotation
process; sequence corresponds
to the
genomic contig.
Protein products;
model
proteins provided by a
genome
annotation process; sequence
corresponds to the genomic
contig.
Transcript products; model
non-
coding transcripts
provided
by a genomeannotation
process;
sequence corresponds
to the genomic
contig.
Protein products; no
corresponding transcript
record
provided. Primarily used
for bacterial, viral, and
mitochondrial records.
Protein
products; annotated on
NZ_ accessions
(often via
.
精品文档
NS_123456
computational methods).
Genomic Automated Genomic records that
represent
an assembly which does not
reflect the structure
of a real
biological molecule. The
assembly may
represent an
unordered assembly of
unplaced
scaffolds, or it may
represent
an assembly of DNA sequences
generated from a biological
sample
that may not
represent a
single
organism.
.
介值定理-personalized
水上城市-猜忌是什么意思
became什么意思-修养是什么意思
绵延不绝-硫酸钾镁
企望的近义词-tongue的音标
初中生物复习资料-enter
amazing是什么意思-ben什么意思
surprise的用法-盛满
-
上一篇:再也不相信爱情的句子
下一篇:对不起怎么造句