悬旗-灰鹅
一、 单选(60)
GenBank 中字符的意思
Nucleotide 数据库分为三个子数据库:
·EST
:表达序列标记数据库
·GSS :基因组测序序列数据库
·CoreNucleotide :包含所有未被以上两个子数据库收录的核苷酸序列
● MeSH: 查询缩写基因的全称
3、RefSeq(Reference Sequence)序列接受号:
(1)mRNA 记录(NM_*):
e.g.:NM_000492
(2)基因组的DNA重叠群(NT_*):
e.g.:NT_000347
(3)完整的基因组或染色体(NC_*):
e.g.:NC_000907
(4)基因组的局部区域(NG_*):
e.g.:NG_000019
页脚内容1
一、
单选(60)
(5)从人类基因组注释、加工得到的序列模型(XM,XP,or
XR_*):
e.g.:XM_000483
●
GenBank记录中特性表中的主要关键词:
关键词
解 释
关键词
解 释
misc_feature
生物学特性无法用特
promoter
性表关键词描述的序
列
转录起始区
misc_difference
序列特性无法用特性
CAAT_signal
表关键词描述的序列
真核启动子上游的
CAAT盒,与RNA结合相
关
conflict
同一序列在不同的研
TATA_signal
究中在位点或区域上
有差异
真核启动子的TATA盒
unsure
序列不能确定的区域
-35_signal
原核启动子中的-35
框
old_sequence
该序列对以前的版本
-10_signal
原核启动子的Pribow
页脚内容2
一、
单选(60)
做过修订
盒
variation
包含稳定突变的序列
GC_signal
真核启动子的GC盒
modified_base
修饰过的核苷酸
RBS
核糖体结合位点
gene
已识别为基因或已命
polyA_signal
RNA转录本的剪切识
名的序列区域
别位点
misc_signal
无法用信号特性关键
enhancer
词描述的信号序列
增强子
关键词
解 释
关键词
解 释
attenuator
与转录终止有关的序列
CDS
蛋白质编码序列
terminator
转录终止序列
sig_peptide
编码信号肽的序列
rep_origin
双链DNA复制起始区
transit_peptide
转运蛋白编码序列
misc_RNA
无法用RNA关键词描述的转录
mat_peptide
物或RNA产物
编码成熟肽的序列
页脚内容3
一、 单选(60)
prim_transcript
初始转录本
intron
内含子
precursor_RNA
前体RNA
polyA_site
RNA转录本的多聚腺苷酸化
位点
mRNA
信使RNA
rRNA
核糖体RNA
5’clip
前体转录本中被剪切掉的5’
tRNA
端序列
转运RNA
3’ clip
前体转录本中被剪切掉的3’
scRNA
端序列
小细胞质RNA
5’UTR
5’非翻译区
snRNA
小核RNA
3’UTR
exon
3’非翻译区
外显子
snoRNA
加工和修饰rRNA的小核RNA
关键词
解 释
关键词
解 释
immunoglobulin_related
repeat_unit
单个的重复元件
C_region
免疫相关蛋白上的不变区
LTR
长末端重复序列
页脚内容4
一、
单选(60)
D_segment
免疫球蛋白重链的可变区,
T细胞受体β链
Satellite
卫星重复序列
J_ segment
免疫球蛋白重链、轻链以及T
misc_binding
细胞α、β、γ的结合链
无法描述的核酸序列结
合位点
N_ region
插入重排免疫球蛋白片段间
primer_bind
的核苷酸
复制、转录的引物结合位
点
S_ region
免疫球蛋白重链的开关区
protein_bind
蛋白质结合区
V_ region
编码免疫球蛋白的可变区N末
STS
端的序列
测序标签位点
V_ segment
编码免疫球蛋白的可变区的
misc_recomb
序列
无法用重组特性关键词
描述的重组事件
repeat_region
基因组中所包含的重复序列
iDNA
通过重组所消除的DNA
misc_structure
无法用结构关键词描述的核
stem_loop
酸序列高级结构或构型
发夹结构
D_loop
线粒体中DNA中的取代
页脚内容5
一、 单选(60)
环
◆
GenBank记录中特性表中的限定词:
限定词
含
义
限定词
含 义
allele=
给定基因的等位基因
codon_start=
相对于序列第一个碱基,
编码序列密码子的偏移量
bound_moiety=
嵌合范围
country=
DNA样本的来源国
cell_type=
获得序列的细胞类型
db_xref=
其他数据库信息的交叉索
引号
citation=
已被引用的参考文献数
direction=
DNA复制方向
clone_lib=
获得序列的克隆文库
environmental_sample=
序列直接从环境材料中获
得而没有指明来源物种
限定词
含 义
限定词
含 义
exception=
指明DNA序列未按通常的生物
PCR_conditi-ons=
学规律翻译,如RNA编辑
描述PCR的反应条件
页脚内容6
一、 单选(60)
frequency=
在种群中发生变异的频率
pop_variant=
获得序列的群体变异种名
称
germline
如果序列是DNA并来源于免疫
product=
球蛋白家族,则表示该序列来
源于未重排DNA
序列编码产物的名称
insertion_seq=
序列来源于某种插入元件
anticodon=
tRNA反义密码子的位置及
它所编码的氨基酸
isolate=
序列来源的生物个体
cell_line=
获得序列的细胞系
lab_host=
为扩增序列来源物种所用的实
chromosome=
验室宿主
获得序列的染色体
macronuclear
指明DNA来源于染色体分化的
clone=
大核期
获得序列的克隆子
note=
评论及附加信息
codon=
指出与参考密码子不同的
密码子
organelle=
获得序列的细胞器
EC_number=
序列产物的酶学编号
sub_strain=
获得序列的来源微生物亚种
transl_table=
描述在翻译中与通用密码
页脚内容7
一、 单选(60)
表不同的密码表
tissue_type=
获得序列组织类型
usedin=
表明该特性在其他检索中
也被使用
translation=
按通用或指定的密码子表翻译
virion
的氨基酸序列
病毒颗粒
限定词
含
义
限定词
含 义
cons_splice=
区分内含子剪切位点和
map=
“5‘--3'”剪切位点
相关特性在基因图谱上的位置
cultivar=
所获序列植物的栽培变种
mod_base=
被修饰碱基的简写
dev_stage=
序列来源于某种生物的特定
number=
发育阶段
从5’→3’注明遗传元件的顺序
evidence=
序列特性来源于实验还是推
organism=
理
提供测序用遗传物质的物种的
科学名称
focus
指出在记录中的来源特性在
phenotype=
序列特性所导致的表型
页脚内容8
一、
单选(60)
其他物种中还有不同的来源
特性
function=
序列所代表的功能
plasmid=
获得序列的质粒名称
haplotype=
序列来源于某种物种的单倍
protein_id=
体
蛋白质的检索号
isolation_sou-rce=
描述序列来源物种的生理、环
proviral
境和地理信息
整合在基因组中的前病毒
label=
序列特性的俗名
rearranged
如果序列是DNA并来源于免疫
球蛋白家族,则表示该序列来
源于重排DNA
限定词
含 义
限定词
含
义
rpt_family=
重复序列
transposon=
转座子
rpt_unit=
指明重复区域的重复元件构
variety=
成
获得序列的生物变种
serotype=
同一物种的不同血清学特征
pseudo
假基因
页脚内容9
一、 单选(60)
sex=
获得序列的物种性别
replace=
表明特性间的间隔序列
已被替换
specimen_vou-
cher=
指明来源物种保存于什么地
rpt_type=
方
重复序列的组织方式
strain=
获得序列的菌珠
sequenced_m-ol=
获得序列的分子类型
sub_species=
获得序列的来源物种的亚种
serovar=
同一原核生物的血清学
特征
tissue_lib=
获得序列组织库
specific_host=
获得序列的天然宿主
transgenic
指明物种的来源特性是否是
standard-name=
转基因受体
特性的通用名称
transl_except=
标明序列中未按指定密码子
sub_clone=
表翻译的氨基酸的位置
获得序列的亚克隆
◆ BLAST
1.
blastn (nucleotide blas
t)是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同
所查序列作一对一地核酸序列比
对。
2.
blastp (protein blast)是蛋白序列到蛋白库中
的一种查询。库中存在的每条已知序列将逐一地
页脚内容10
一、
单选(60)
同每条所查序列作一对一的序列比对。
3.
bl
astx是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列
会被翻译成可
能的六条蛋白),再对每一条作一对一的蛋白序列比对。
4.
tblastn是蛋
白序列到核酸库中的一种查询。与blastx相反,它是将库中的核酸序列翻译成
蛋白序列,再同所查
序列作蛋白与蛋白的比对。
5.
tblastx是核酸序列到核酸库中的一种查询
。此种查询将库中的核酸序列和所查的核酸序列
都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列
),这样每次比对会产生36种比对阵
列。
Accession
Molecule Method Note
AC_123456 Genomic Mixed
Alternate complete genomic molecule.
This
prefix is used for records that are
provided
to reflect an alternate
assembly or
annotation. Primarily
used for viral,
prokaryotic records.
AP_123456 Protein Mixed
Protein products; alternate protein
record.
This prefix is used for records
that are
provided to reflect an
alternate assembly or
annotation. The
AP_ prefix was originally
designated
for bacterial proteins but this
usage
页脚内容11
一、 单选(60)
was changed.
NC_123456 Genomic Mixed
Complete genomic molecules including
genomes,
chromosomes, organelles,
plasmids.
NG_123456 Genomic Mixed Incomplete genomic
region; supplied
to support the NCBI genome
annotation
pipeline. Represents either
non-transcribed pseudogenes, or
larger
regions representing a gene
cluster that is
difficult to annotate via
automatic methods.
NM_123456
NM_123456789
mRNA Mixed
Transcript products; mature messenger
RNA
(mRNA) transcripts.
NP_123456
NP_123456789
Protein Mixed Protein products; primarily
full-length
precursor products but may include
some partial proteins and mature
peptide
products.
NR_123456 RNA Mixed Non-coding
transcripts including
structural RNAs,
transcribed
页脚内容12
一、
单选(60)
pseudogenes, and others.
NT_123456 Genomic Automated Intermediate
genomic assemblies of
BAC andor Whole Genome
Shotgun
sequence data.
NW_123456
NW_123456789
Genomic Automated
Intermediate genomic assemblies of
BAC or
Whole Genome Shotgun
sequence data.
NZ_ABCD12345678 Genomic Automated A collection
of whole genome shotgun
sequence data for a
project. Accessions
are not tracked between
releases. The
first four characters following
the
underscore (e.g. 'ABCD') identifies a
genome project.
XM_123456
XM_123456789
mRNA Automated Transcript products; model mRNA
provided by a genome annotation
process;
sequence corresponds to the
genomic contig.
XP_123456
XP_123456789
Protein
Automated Protein products; model proteins
provided by a genome annotation
process;
sequence corresponds to the
页脚内容13
一、 单选(60)
genomic contig.
XR_123456 RNA Automated Transcript products;
model non-coding
transcripts provided by a
genome
annotation process; sequence
corresponds to the genomic contig.
YP_123456
YP_123456789
Protein Mixed
Protein products; no corresponding
transcript
record provided. Primarily
used for bacterial,
viral, and
mitochondrial records.
ZP_12345678 Protein Automated Protein
products; annotated on NZ_
accessions (often
via computational
methods).
NS_123456
Genomic Automated Genomic records that represent
an
assembly which does not reflect the
structure of a real biological molecule.
The assembly may represent an
unordered
assembly of unplaced
scaffolds, or it may
represent an
assembly of DNA sequences
generated
from a biological sample that may
not
页脚内容14
一、 单选(60)
represent a single organism.
页脚内容15
初中化学方程式总结-英语学习视频网站
退刀槽-科学用英语怎么说
outcast-双的反义词是什么
狡黠怎么读-九转丹
精通英语-韩语和朝鲜语有区别吗
萦绕的意思-炫的组词
数学ppt背景图片-audience复数
无明是什么意思-沾的意思
-
上一篇:区域的基本含义
下一篇:区域的基本含义 教案