-
文档来源为
:
从网络收集整理
< br>.word
版本可编辑
.
欢迎下
载支持
.
第三章
基因和基因组
第一节
基因组的大小与
C
值矛盾
一、相关概念
☆
基因
(gene)
p>
是合成一种功能蛋白或
RNA
分子所必须的
全部
DNA
序列.
一个典型的真核基因包括
①编码序列
—
外显子
(exon)
②插入外显
子之间的非编码序列
—
内合子
(int
ron)
③
5
‘
-
端和
3
’
-
端非翻译区
(UTR)
④调控序列
(
可位于上述三种序列中
)
基因平
均由
1000
个碱基对组成,一个
DN
A
分子可能包含几个或几千个基因。
☆
基因组
(
genome
)
:
< br>一特定生物体的整套
(
单倍体
)
遗传物质的总和,即生物体维持
配子或配子体正常功能的全套染
色体
所含的全部基因(
DNA
)
。基因组的大小用全部
DNA
的碱基对总数表示。比如人基因组的全长为大约
3
×
109
对碱基,编码
3-4
万个蛋
白分子。细菌或噬菌体、病毒---单个
染色体中所含的全部基因(
DNA
)
。
人类基因组计划(
human
genome project
HGP
)
基
因组学(
genomics
)
结构基因组学(
structural
genomics
)
功能基因组学(
functional
genomics
)
☆
C
p>
值(
C-value
)
:在真核生物中,每种生物的单倍体基因组的
DNA
总量总
是恒定
的,称为
C-
值
低等真核生物中与形态学复杂程度相关,但高等真核生物中变化很大
所谓
C
值
(C
value)
即单倍体基因组的
DNA
总量。
它是每一种活生物的一个性质。
C
值大小有着巨大差异。小到象支原体那样的不足
106bp
,
大到一些植物及两栖类的
10
11
bp
。
进化中不同门的
< br>C
值范围。
随着复杂度的增加,
基因组大小的最小值是增加的。
但
是随着高等真核生物
DNA
绝对量的增长,有些门的基因组大小出现了很大的变化。
每门的一种生物
DNA
的最小量
要使原核生物比低等真
核生物更复杂,增加基因
组大小是必要的。
< br>1
文档收集于互联网,如有不妥请联系删除
.
文档来源为
:
从网络收集整理
< br>.word
版本可编辑
.
欢迎下
载支持
.
盐沼核菌
(pyrenomas
sa
lina)
是现已证明的含有最小基因组的真核生物,它有
6.
6
×
105bp
,
(然而这些生物可能并不是真正的真核生物,但可能是进化的中间阶段,代表了
细胞
核与叶绿体的原始存在形式。
)支原体是最小的原核生物,它的基因组大小只是一
个大噬菌体的
3
倍(
T4
基因组为
1.7
×
105bp
)
。细菌基因组大小至少为
2
×
106bp
。单细
胞真核生物(其生命周期可能包含原核时期)的基因组大小也是这么小,尽管它比细菌
基因组稍大些。作为真核细胞
per se
并不
意味着需要基因组大小有很大的增加。酵母的
基因组大小可以只有约
1.3
×
107bp
,仅仅是最大
的细菌基因组大小的两倍。
黏菌
D.
Discoideum
的基因组比酵母大了两倍,它可以以单细
胞或多细胞的形式存在。
为了第一个完全的多细胞生物,复杂度增长是十分必要的。线虫
(
c.
elegans
)的
DNA
容量为
8
×
p>
107bp
。
沿
着进化树上行,我们可以看出,尽管基因组大小的增长对于昆虫、鸟类或是两栖
动物与哺
乳动物这些物种的产生是非常重要的,但复杂度与
DNA
的关系
变得模糊了。
二、
C
值矛盾与表现
C
值矛盾
(
C-value
paradox
C-
悖理)
:
形态学的复杂程度与
C-
值的不一致
称为
C
-
矛盾。
主要有以下几方面的体现
之一:
物种之间--形态学的复杂性和
C
-值的复杂性不成正相关
p>
a
、生物进化程度与
C
-值的矛盾。两栖类与哺乳类之间
b
、亲缘关系相近的生物
C-
值相
差较大
例
p>
1
:两栖类的
C-
值范围
例
p>
2
:一种普通果蝇的基因组为
1.4
X108
,而一种普通家蝇的为
8.6 X 108
之二:
与预期的编码蛋白质的基因的
数量相比,基因组的
DNA
含量过多。
例:人类与
编码基因数目的比较研究。
.
4
X 106bp DN A
约编码
3000
种
基因。人类
29 X 108 bp
的
DNA
是大肠杆菌的
700
多倍。有上百万个基因???
此外:根据不同细胞中的
mRNA
数目来估算表达基因的方法。
?
持家基因(
housekeeping
gene
)
:
有些基因是在所有的细胞类型中都表达的,
即这些基因的功能为所有细胞所必须(或称组成型基因
constitutive
gene
)
。
?
奢侈基因(
luxury gene
)
:
仅在某种特定类型的细胞中表达的基因。
哺乳动物的每种表型的细胞表达的基因约为
1
X
104
个,这样整个哺乳动物的基
因
2
文档收集于互联网,如有不妥请联系删除
< br>.
文档来源为
:
从网络收集整
理
.word
版本可编辑
.
欢迎下载支持
.
数目要多于每种细胞的表达数,
估计应该有
1 X 105
个
(不同书上有一定偏差)
,
约为大
肠杆菌的
30
倍,那么
90
%以上的
DNA
功能何在??
第二节
细菌和病毒基因组
一、大肠杆菌(
Escherichia
coli
)
1
、大肠杆菌在实际工作中的重要性
经常被当作是所有生物的原型(
archetype
)
:
a
、在实验室中容易操作
b
、生长迅速,要求营养物质简单,能进行很多生理生化过程
c
、其有性生殖的存在使得遗传学的研究成为可能
(
遗传杂交、遗传性状、存在性状
)
d
、能够
供应细菌病毒的生长,使病毒的本性即病毒扩增
的深入研究成为可能。
2
、大肠杆菌的遗传物质
(
1
)
染色体
DNA
p>
需要基因组
DNA
的一些相关操作一般选择
对数生长期的
(
< br>2
~
4
个类核)
以获得丰富的基因组
DNA
?
p>
类核中,染色体
DNA
成分占
80
%,其余为
RNA
和蛋
白质
?
4.6 x
106bp
的基因组
DNA
与多种<
/p>
DNA
结合蛋白质组装成
的染色体
?
基因组
DNA
为双链环状,总长度为
1100
~
1400
μ
m
,
1400
个基因都已定位
小心地将大肠杆菌的
DNA
< br>与它的大多数结合蛋白分离开,在电子显微镜下就可观
察到拟核的组构,
其
DNA
由
50~10
0
个环或结构域组成,
这些环或结构域的末端被与细
胞膜的一部分相连的蛋白固定。环的大小为
50~100kb
。
?
的基因组的特点
a
、功能相关的几个结构基因以操纵元
(operon)<
/p>
的形式存在
其中包括共同的调节基因、启动子(
promoter
)
、操作子
(ope
rator),
在基因转录时
协同动作。
b
.结构基因中没有内含子,也无重叠现象。
c
.细菌
DNA
大部分为编码序列。
d
、
RNA
基因往往多拷贝,蛋白质
为单拷贝。
(
2
)
p>
质粒
DNA
(
pl
asmid
DNA
)
3
文档收集于互联网,如有不妥请联系删除
.
< br>文档来源为
:
从网络收集整理
.
word
版本可编辑
.
欢迎下载支持<
/p>
.
细菌中另一类遗传物质,环状
DNA
,存在于染色体之外,能自我复制,质粒也携
带许多基因,如:
抗生素抗性基因
3
、大肠杆菌的酶类
细胞中
含有核酸代谢所需的酶类,除了
DNA
聚合酶(
DNA polymerase
)
、
< br>RNA
聚合酶
(
RNA
polymerase
)
,还
有多种限制性内切酶(
restriction
endonuclease
)
限制性内切酶是分子生物学实验操作中最基本的工具酶,在
DNA
p>
测序、片段分离、
克隆
DNA
的环节都要用到
二、病毒基因组的特点
1
.每种病毒只有一种核酸,或者
DNA
,或者
RNA
;
2
.病毒核酸大小差别很大,
3X103
一
3X106bp
;
3
.除逆病毒外,所有病毒基因都是单拷贝的。
4
.大部份病毒核酸是由一条双链或单链分子
(
RNA
或
DNA)
,仅少数
RNA
病毒由几个
核酸片段组成.
5
.真核病毒基因有内含
子,而噬菌体(感染细菌的病毒)基因中无内含子.
6
.有重叠基因
2
、λ噬菌体
*
双链
D
NA
,长度
48Kb
,其
DNA
分子有三种存在形式
a
、两个粘性末端分离的线性分子
COS
位点
(cohesive-end site)
b
、带有切刻的环状分子(开环的粘性末端互补后未连接的
c
、闭合环状分子(粘性末端互补,
DNA
连接酶连接)
*
其基因均是按功能相近的聚集成簇的(两个正调节基因
N
和
p>
Q
除外)
其基因
的组织形式,除两个正调节基因
N
和
Q
之外,均是按功能相近的聚集成簇
的。λ噬菌体的
7
个头部基因
A~F
占有相
互邻接的位置,调控基因
N
、
CI
p>
、
CII
、
CII
I
、
Cro
也集中在一个区域。此外,
结构基因与它们所编码的蛋白质所作用的部位也在邻接
的部位,例如整合基因
int
和切离基因
xis
处在附着点
att
的旁边;复制基因
O
和
P
处在
复制
起始点旁边。
*
存在形式
在寄主体内有溶源生长周期
(原噬菌体)和溶菌生长周期两种生活途径
第四节
真核生物的染色体与基因
4
文档收集于互联网,如有不妥请联系删除
.
文
档来源为
:
从网络收集整理
.word
版本可编辑
.
欢迎下载支持
.
一
、真核生物染色体结构回顾
二、真核生物
DNA
的复性动力学
(
重新结合动力学
Reassociation
kinetics
)
●
真核生物复性动力学研究
真核生物基因组大小的范围产生了一个重要问题:
是否较大的基因组含有较多的基
因,或者只是含有与较小基因组相同的基因
但更多的拷贝呢。如果基因种类随基因组大
小增长而增长,我们应该可以期望基因组中独
特
DNA
序列将增长。而如果只是简单拥
有更多拷贝,这种事情将不会发生。
真核基因组的普遍性质
可以通过变性
DNA
重组动力学去获得。互补序列的重组是
p>
依靠碱基配对的原则发生的,是使双链分开的变性过程的反过程。这种技术可以被拓展
到利用它们与特殊探针杂交的能力分离单个
DNA
或
RNA
。
重组反应动力学反映出
了各
种不同序列的存在。因此这个反应可以被用来将基因以及它们的
RNA
产物定量化。
●
复性动力学的研究方法
一般我们可以
通过以下两种方法检测在复性反应中单链已经合成双链
:
(<
/p>
1
)减色效应(
hyp0ochromi
c effect
)
和增色
效应相反,
由于双链逐渐增多,
对
26
0nm
的紫外线吸收会相应减弱。
因此测
定光密度,即
OD
值(
optica
l density
)即可。
DNA
从
单链变成双链,
OD
减少
30%
。
(
2
)羟基磷灰石层析
羟基磷灰石的特点是对双链<
/p>
DNA
吸附较牢,不宜吸附单链,我们将样品过柱,然
后用不同浓度的缓冲夜洗脱,就可以收集单链和双链
DNA
,计算相的浓度。
●
C0t
曲线
p>
DNA
复性依赖于互补链的自由碰撞,并且符合二级动力学方程。单
链消失的速度
可用下面公式表示:
-dC/dt=kC2
其中<
/p>
C
为单链
DNA
的浓度,单位是每开的核苷酸摩尔数;
t
是时间,单位为秒;<
/p>
k
是二级反应常数,单位是升/
mol<
/p>
秒,
k
值取决于阳离子浓度、温度,片断
大小和
DNA
分子序列的复杂性
(se
quence
complexity
of
the
DNA
population
)
。上面公式可以重排为
-dC/C2=kdt
。当
t
=
0
时,
C
=
C0
,将上式积分:
-
〔
1/C0-1/C
=
k
t
,即
1/C-1/C0
=
kt
,可
重排成
C/C0
=1/(1+kCot)
。在上式中,当
t=0
时,
C
=
C0
,表明所有的
DNA
都是单链。
C0
为
DNA
的总浓度。
复性的分数
C
/
C0
是起始浓度和经过时间的乘积
Cot
的函
5
文档收集
于互联网,如有不妥请联系删除
.
文档来源为
:
从网络收集整理
.word
版本可编辑
.
欢迎下载支持
.
数,这样的函数可以绘成下面的左图,称为
Cot
曲线。当
C/
C0=1/2
时的
Cot
值定义为
Cot1/2,
因此
Cot1/2=1/k
。
任何
DNA
的反应可以用其
半复性条件表示。即
C0
×
t1/2<
/p>
之乘积,称为
Cot1/2
。
Cot1/2
等于浓度与达到最大数度一半所需时间之积,与速率成反比,
Cot1/2
增大意味着反应速
度变慢
的。
Cot1/2
代表了基因组的大
小和
DNA
顺序的复杂程度。
在一个指定的实验里,
C0
是已知的,
C
可以测定,如以
C/C0
< br>对
C0t
作图,可得如
图所示的
曲线。在曲线的中点,即
C/C0=1/2
时,
C0t=1/K
。
各个不同
的
DNA
的
cot
值是不同的,
不仅与
k
值相关,<
/p>
而且
DNA
分子序列的复杂性影
响
k
值。
DNA
分子的序列的复杂性
X
值定义为:最长的没有
重复序列的核苷酸对的数
值,例如(
ATATAT
…
)
,其
X
值为
2
,
(
< br>ATGC
)的
X
值为
4
,没有重复序列的含有
10
核苷酸对的
DNA
分子的
X
值为
105
。
在
DNA
总
浓度
(
以核苷酸为单位
)
相同的情况
下,片断越短,片断浓度就越高,复性所需的时间也越短
t1/2
也越小,因此,
x
值与的
关系是
X
=
K Cot1/2
。其中,比例常数
K
将取决于反应条件
(
阳离子浓度,片断大小等
)
,
在通常使用的标准状况下
< br>(0.18
当量的阳离子,
片断大小
400
个核苷
)
.
K=5
×
105(
升×核
p>
苷酸对/核苷酸
mole
×秒
)
,即在此条件下,
X
=<
/p>
5
×
105Cot1/2(
核苷酸对
)
。
DNA
复性通常符合
Cot
曲线
(Cot curve)
。
Co
t
曲线标出了
DNA
复性的部分
(1-C/C0)
和横
轴上的
Cot
值。图中给出了几个简单基因组的
Cot <
/p>
曲线。每一曲线的形状都相同,在
点
10
%
和
90%
反应之间
< br>Cot
值相差
100
倍。但是
每个曲线的
Cot1/2
值是不同的。
p>
图中的基因组代表了不同的
DNA
,其序列
不同且越来越长。
Cot1/2
值直接与基因
< br>组中
DNA
含量相关。这表明随着基因组复杂性增加,在
给定的
DNA
中一个特定序列
的拷贝数
减少。例如,如果
DNA
的
C0
p>
值为
12pg
,那么一个大小为
0.004pg
的细菌基
因组中每个序列有
3000
个拷贝,但是在
3pg
的真核基因组中每个序列只有
4
个拷
贝。
因此同样以摩尔核苷酸每升表示的
DNA
绝对浓度
(
即
C0)
表明每个真核序列比细菌序列
少
3000/4=
750
倍。
由于复
性的速率依赖于互补链的浓度,假如真核序列和细菌序列有相同的浓度,那
么真核序列应
多达
750
倍的
DNA(
或者将同样大的
DNA
反应
750
倍长的时间
)
。因此
真核反应的
Cot
1/2
是细菌的
750
倍。
一个反应的
Cot1/2
表明所包含不同序列的总长度,用复杂度
(C
omplexity)
表示,通常以
碱基对为单位。
任何基因组
(
或者基因组的一部分
)
复性的
Cot1/2
与其
复杂度成正比。
任
何
DNA
的复杂度可以通过与复杂度已知的
DNA Cot1/2
< br>比较得出。
通常以大肠杆菌
DNA
6
文档收集于互联网,如有不妥请联系删除
.
文档来源为
:
从网络收集整理
.word
版本可编辑
.
欢迎下载支
持
.
作为标准。假设
4.2
×
10
6
bp
大肠杆菌基因组由不同序列组成
:
基因组复杂度
= Cot1/2(
基因
组
DNA)
×
4.6
< br>×
10
6
bp /
6(
大肠杆菌
DNA)
●
真核生物复性动力学研究
当用复性动力学方程确定真核基因组
DNA
时,通常
Cot
值跨越
8
个数量级。这比从
前图
推测出的
100
倍范围大的多。其原
因在于前图每一曲线都符合含有单一成分的复
性动力学方程,而真核基因组实际上包括几
种这样的成分,每种成分都以其特定动力学
复性。
Cot
曲线分析表明,真核和细菌基因组之间存在重要区别:细菌基因组仅由单一
成分组成,而真核基因组要复杂得多。
真核生物基因组包含的几种序列成分
图中
给出了某种(假想)真核生物基因组,起始于
c0t
值为
10-4
,终止于
c0t
值为
104
。
这个反应分为三个明显的相区,用阴影框住。在前两相区区间有一个平台区,而后两个
< br>相区则有重叠。每个相区都代表了基因组不同的动力学成分:
1
.
快速
组分是重组的第一部分。
在这里点总
DNA
的
25%
,
在
cot
值
10-4
至约
2
×
10-2
间复性,<
/p>
cot?
值为
0.0013
。
2
.
紧接
着是中间组分。占
DNA
的
30%
p>
,在
cot
值
0.
2
到
100
间复性
, cot?
值为
1.9.
3
.
慢组
分是最后复性的部分。
占总
DNA
的<
/p>
45%
,
在
co
t
范围
100-10000
间复性,<
/p>
cot?-
为
630
。
为了计算这些组分的复杂度,
每个组
分都必须视为独立的动力学组分进行对待并与
标准
DNA
比较。慢组分占总
DNA45%
,在复性反应
中它的浓度测定
Co
的
0.45
倍(
Co
为存在
DN
A
的总量)
。这样慢组分
cot?
p>
为
0.45
×
63
0=283
因此,
如果慢组分被纯化出进单独复
性,
其复性将以
cot?
为
283
进行。
假定这些条
件下,大肠杆菌
DNA
以
cot?
p>
为
40
复性。比较这两个值,我们可以发现
这个组分复杂
性为
3.0
×
108bp.
用同样方法处理其他组分表明
,
p>
中间成分复杂度为
6
×
1015bp,
快速组分
为
340
bp.
这为我们提供了一个进行量化的依据
:
< br>组分重组越快复杂性越低。
反过来
,
如果我们把三种
DNA
每种含有的独
特序列均为恰好长度
(
340bp
,<
/p>
6
×
105bp
与
3
×
108bp
)
,
并且以质量比
25
:
30
混合,
每一种组分
就会如同仍是单一组分一样进行
重组。并且总起来说混合物将显示出与
< br>图中
全基因组相同的动力学图。
最慢成分的复杂度符合其物理大小。假设图
3.5
中复性的基因组为
7.0
×
108
bp
的
单倍体
DNA(
由化学分析而知
)
。那么其
45%
就是
3.15
×
108 bp
,只比由复性动力学计算
获得的
3.0
×
10
8
bp
稍高一点。考虑到技术上的小偏差,可以认为用化学和
动力学测得
7
文档收集于互联网,如有不妥请联系删除
.
文档来源为
:
从网
络收集整理
.word
版本可编辑
.<
/p>
欢迎下载支持
.
最慢成分的复杂度基本相同。
最慢成
分由基因组中独特的序列组成:变性后,每个单链序列只能与其相应的互补
链复性。最慢
成分是原核基因组中唯一组成成分,通常也是真核生物中的主要成分,称
为非重复
(Nonrepetitive )DNA
。
p>
比非重复序列复性快很多的成分的本质是什么呢?在图所示的例子中,
中间成分占
基因组的
35%
,其化学
复杂度为
0.3
×
7
< br>×
108=2.1
×
108 b
p
。但是其动力学复杂度只有
6
×
p>
105
bp
。与复性
Cot1/2
相对应的
DNA
独特
长度比基因组中该成分的
DNA
化学长度
要短得多。换言之,中间成分由基因组中长度为
6
×
105(
因
350
×<
/p>
6
×
105=2.1
×
108)
的
350
个拷贝组成。变性之后,任何一个拷贝产生的单链能够与来自
350
p>
个拷贝的互补链
复性。这有效地提高了复性反应中反应序列的浓度,
可以解释为什么该成分以很低的
Cot1/2
值复性。
在每个基因组中不止一次出现的序列称为重复
(Repetitive) DNA
,
其在每个基因组
中
出现的拷贝数称为重复频率
(Repetition fre
quency
,
f)
。
根据其重复频率,
重复
DNA
通常
分为两大类型,与图所示中间成分和快成分相对应。
p>
图所示中间成分包括总长度为
6
×
105 bp
的
DNA
,在每个基因组中重复了
350
次。
但
是这并不指单个,能确定连续长度的
DNA
。相反,它由一系列
序列组成,每个都短
于
6
×
105
bp
,其总长度等于这个数值。这些序列
分散在基因组中,其平均重复次数为
350
次,但有些会以更多的重复频率出现,有些则出现很少。
把每一个组分单独提取作复性试验,有一个
C0t(1/2)
值矫正,因混合组分复性时,该
组份
C
值为
C0 X
百分数
C0t(1/2)
值矫正
:
25%
×
0.0013
=
0.000305
30%
×
1.9
=
0.57
45%
×
630
=
283
如果同样条件下:
C0t(1/2) of
DNA= 6
Kinetic
Complexity of
=
4.6
×
10
6
则各种复性组分的复杂性可以计算出:
Kinetic Complexity of
慢复性组分
=
4.6
×
106 X 283
/
6= 3.0
X10
8
往往假定慢复性组分为单一序列
即重复频率(
Repetitive
frequency
)
f =1
Genome
DNA
总长度
×
该组份所占的比例
8
文档收集于互联网,如有不妥请联系删除
.
而
f
=
该组份的动力学复杂性(
K.C.<
/p>
)
文档来源为
:
从网络收集整理
.word
版本可编
辑
.
欢迎下载支持
.
即反推
Genome
DNA
总长度
=(
f
×
K.C.
)/该组份所占比例
(近似值)
=(
1
×
3.0
×
108
)/
45
%
=
6.7
×
10
8
所以
,快复性组分和中间复性组分的
K.C.
和
f
值可以计算得到
340
,
500.000
6.0
×
10
5<
/p>
,
350
●
真核生物复性动力学研究发现了重复序列
三、
DNA
的序列类型
1
、
高度重复序列(
Highly repetitive
sequence
)
重复
DNA
是根据它
(
相对<
/p>
)
快速的复性速度确定的。在真核生物基因组中复性速度最快
p>
的组分称为高度重复
DNA
,是由非常短的
在巨大基因簇中串联重复多次的序列组成。
由于它的重复单位很短,
有时称为简单序列
DNA (Simple sequence DNA)
。
这类
DNA
几
乎存在全部真核生物基因组内。此类
DNA
中
除了含有大的基因簇以外,还散布着非重
复
DNA
的小一些的基因簇。这些小基因簇含有短的序列,这些短序列在基因组中相同
或相关拷贝中重复。
双链
DNA
的浮力密度取决于它的
G-C
含量。
当真核生物
DNA
进行密度梯度离心
时,可以分成两个部分。大部分基因组形成由许多组分形
成的连续区域,看起来像是一
个按相当于该基因组平均
G-C<
/p>
含量的浮力密度集中的颇宽的峰,
这个峰称为主带。
有时
看到另外一个
(
或一些
)
大小不同的小峰,这部分称为卫星
(
Satellite) DNA
。卫星
DNA
< br>这
种叫法实际是简单序列
DNA
的同义词。与简单序列一样,卫星
DNA
不能转录和翻译。
p>
卫星
DNA
(<
/p>
Satellite
DNA
)
:
将
DNA
切成数百个
碱基对的片段进行超速离心时,由于
富含
AT
< br>的简单高度重复序列区段浮力密度较小,因而很容易和总体
DNA
分开,即常
会在主要的
DNA
带的上面有一个次要的带相伴随
.
卫星存在于很多真核基因组中。它
们可能比主带重也可能比主带轻。但它们在总
DNA
中的比例很
少大于
5%
。小鼠
DNA
是一个很好的例子
(
图
)
,该图是小鼠
DNA
经
CsCl
密度梯度离心区带的定量扫描图谱。主带含基因组的
< br>92%
,并集中于
1.701g-cm-3
的浮力密度区
(
相当于它的平均
G-C
值为
42%
,这是典型的
哺乳动物的
G-C
值
)
。较小
的峰相当于基因组的
8%
,浮力密度为
1.690
g-cm-3
< br>,含有小鼠卫星
DNA
,该
DN
A
的
G-C
含量远低于基
9
文档收集于互联网,如有不妥请联系删除
.
文档来源为<
/p>
:
从网络收集整理
.word
版本可编辑
.
欢迎下载支持
.
因组的任何其他部分
(
大概为<
/p>
30%)
。
基因组
中大多数高度重复
DNA
可以以卫星的形式分离出来。当某高度
重复
DNA
成分不能作为一个卫星分离出来时,根据离心可以证
明它与卫星
DNA
的性质类似。也
就是
说,
它由多重串联重复组成,
并有异常离心行为。
以这种方式被分离出来的
DNA
有
时候叫隐蔽卫星
(Cryptic
satellite)
。隐蔽卫星和可见卫星通常构成全部高度重复
DNA
的
串联重复区段。
p>
高度重复区段存在何处?核酸杂交技术的推广使卫星序列的位置可直接在整套染
色体上得到测定。
卫星
D
NA
经常存在于异染色质上。
节肢动物的卫星具有很短的相同的重复序列
在节肢动物中,以昆虫和蟹类为典型,每一个卫星
DNA
都有很高的相似性,通常
卫星的
90
%以上都是由一个很短的重复单位组成,这使得测序变得相对容易。<
/p>
果蝇(
D.
virils
)有三条主要的卫星,并且还有隐卫星,总共占基因组的
< br>40
%以上,
这些卫星的序列已归纳在
< br>表
中。这三条主要的带有非常相近的序列,从卫星Ⅰ只要改变
一个碱基就可以得到卫星Ⅱ或卫星Ⅲ。
卫星Ⅰ的序列也存在于与果蝇相联系的其它种类的果蝇中,因此这很可能是在此物
种形成以前就存在。
卫星Ⅱ和Ⅲ的序列好像是果蝇
(
D. virils
)特有的,因此可能是在物
种形成以后由卫星Ⅰ进化而来的。
这些卫星的主要特征是短小的重复单元:仅有
7
个碱基对,相似
的卫星可以在其它
的物种中找到,果蝇(
gaster
)具有一系列卫星,其中几条含有非常的
重复单元
5
、
7
、
1
0
或
12bp
)
,在蟹类中也可以找到类似的卫星。
在果蝇
(
s
)
中存在的这种卫星间相近的序列关系对于其它基因组并不是必须
的,其它的物种中可
以存在序列不相关的卫星,每一个卫星都是由一段非常短小的序列
向旁边放大而来的,这
些序列可能是由以前存在的卫星变化而来(像在果蝇中)
,或者
还存在着一些其它的起源。
卫星不
断地从基因组中产生和丢失,这使得我们很难弄清其进化关系,因为现存的
卫星可能是由
已经丢失的早期卫星进化而来的,
这些卫星的一个重要特征是
它
是一个复
杂性很低的长链
DNA
,并且
链顺序的恒定性可以保持。
很多这
类卫星
DNA
的一个特征是位于两条链上的碱基是很不对称的,
如表
25.1
所
示
s
卫星,每一个主要卫星的双链中有一条链富含
T.G
p>
碱基,因而增加了其浮力
10
文档收集于互
联网,如有不妥请联系删除
.
文档来源为
:
从网络收集整理
.word
版本
可编辑
.
欢迎下载支持
.
密度,所以在变性的情况下这条
重链(
H
)
可以与其互补的
轻链(
L
)
分离,这一特征
有利于卫星的测
序。
☆
小卫星
Minisatellite DNA
又称可变数串联重复(
Variable
number
tamdem
repeat
,
VNTR
)
存在人类和其他动物中,
由短重复单位
(6-40bp)
p>
串联重复
(6-100
次以上
)
而成,
而且
有共同的核心
序列。在染色体配对过程中,串联重复序列能够错排,因此串联基因簇的
大小多态性很强
,个体间的变化很大,可利用其得到
DNA
指纹图
DNA finger printing
)
p>
多位于基因的非编码区,广泛分布。
VNTR
多态性
—
分子标记
—
DNA
指纹图
(
finger
print
)
.
DNA
指纹技术,又称
DNA
分型技术。该
技术是在
1985
年由英国遗传学家
A
lec
Jeffreys
应用它成功的进行了第一起移民案涉
及的亲子鉴定,
开辟了法医物证
DNA
分析
的先河.最初,
Jeffreys
进行
DNA
分型采用多位点
DNA
指纹技术.将人类基因组中的
数目可变的串联重复序列
(variable number of tandem repeat
.
VNTR)
附近的
DNA
区域用
限制性内切酶切割.
经电泳分离,
然后再与特异性探针杂交产生高度多态性图谱即
DNA
指纹图,又称限制性片断长度多态性技术
(restriction
fragment
length
p
olymorph
—
ism
,
RFLP)
。后来.随着对人类基因组
DNA
多态性遗传标记的研究和认识的深入.检测技
术也从
RFLP
的杂交发展到多聚酶链式反应,出现第二代
DNA
指纹技术——扩增片断
长度多态性分析技术。从最早
的
VNTR
发展到现在的短串联重复
(
short
tandem
repent
,
STR)
,基因位点的多重
PC
R(plymorase chain reaction
.
P
CR)
扩增和四色荧光
DNA
分型<
/p>
技术.不断提高灵敏度,加快检验速度,从原来需要大量生物检材才能满足检验到现在
p>
可以进行单个细胞检验,检验时间从先前的
6
—
8d
到现在的数小时.提高了生物物证的
< br>有效利用率。
DNA
分型技术在向高通量、数码化、自动化方向日趋完善。
小卫星
DNA
突变与肿瘤,
H-Ras
。
☆
微卫星
D
NA
(
Microsatellite
DNA
)
短串联重复(
short tandem
repeat,STR
)
2-6
p>
个核苷酸组成的重复单位串联重复
(10-60
次
),
两侧为特异的单拷贝序列,
人基因组中
每
l0kb DNA
序列至
少一个
STR
序列。
(
CA)n
,
50
,
000-100
,
000
拷贝.
新一代遗传标记,人类基因组研究,肿瘤,遗传病.
通常在哺乳动物基因组中存在一种代表卫星
DNA
的序列,它与卫星类似,是由一
些短的单串联重复组成,但是其重复总长很短,只有(
举个例子)
5
-
50
< br>个重复单位组
11
文档收集于互联网,如有不妥请联系删
除
.
-
-
-
-
-
-
-
-
-
上一篇:基因工程重点总结(完整)
下一篇:英文书信格式+范例