-
百度文库
-
让每个人平等地提升自我
转录组测序结题报告
篇一:转录组测序问题集锦
转录组测序问题集锦
转录组是某个物种或者特定细胞类
型产生的所有转录
本的集合,转录组测序
(RNA-seq)
是最近发展起来的利用深
度测序技术进行转录分析的方法
,
可以对全转录组进行系统
的研究。
Roche
GS FLX Titanium
、
Illumina
Solexa GA IIx
和
AB SOLID
4
均可以对转录组进行测序,
Roche GS FLX
Titanium
与
Illumina
Solexa GA IIx
和
AB SOLID 4
相比,
拥有更长的读长和较小的数据量,适用于表达量较高基因的
RNA
全长测序。但是对低表达丰度的基因,可能需要多次测
序才能得到足够的数据,成本比较高
,而
Illumina
Solexa
GA IIx
和
AB SOLID 4
数据读取量大,能够得到较高的覆盖
率,可以较好的降低成本。
若是位置基因组序列的物种,则
Roche GS FLX Titanium
测序更有优势,其较长的读长便于
拼接,获得更好的转录本数据。
转录组测序可
以供研究者在转录本结构研究(基因边界
鉴定、可变剪切研究等)
,转录本变异研究(如基因融合、
编码区
SNP
研究)
,非编码区域功能研究(
Non-
coding RNA
1
百度文库
-
让每个人平等地提升自我
研究、
p>
miRNA
前体研究等)
,
基因表达水平研究以及全新转录
本发现等方面进行深入研究。
< br>
研究转录组的方法有哪些?
目前研究转录组的方法主要三种,
基
于杂交技术的
cDNA
芯片和寡聚核苷酸芯片,
基于
sanger
测序法的
S
AGE
(serial
analysis
of
gene
expressio
n)
、
LongSAGE
和
MPSS(massively parallel signature sequencing )
,基于
第二代测序技术的转录组测序,又称为
RNA-Seq
。
转录组测序比其他研究方法有哪些优势
?
(
1
p>
)可以直接测定每个转录本片段序列、单核苷酸分
辨率的准确度,同
时不存在传统微阵列杂交的荧光模拟信号
带来的交叉反应和背景噪音问题;
(
< br>2
)灵敏度高,可以检测细胞中少至几个拷贝的稀有
转录
本;
(
3
)可以对任意物种进行全基因组分析,无需预先设
计特异性探针,因此无需了解物种基因信息,能够直接对任
何物种进行转录
组分析,同时能够检测未知基因,发现新的
转录本,并准确地识别可变剪切位点及
cSNP
,
UTR
区
域。
(
4
)检测范围广,高于
6
个数量级的动态检测范围,
能够同时鉴定和定量稀有转录本和正常转录本。<
/p>
2
百度文库
-
让每个人平等地提升自我
转录组测序有什么样的样品要求?
(
1
)
样品纯度要求:
OD
值应在
1.8
至
2.2
之间;
电
泳检测
28S:18S
至少大于
p>
1.8
。
(
2
)样品
浓度:
total
RNA
浓度不低于
400
ng/
μ
g
。
(
3
p>
)
total
RNA
样品请置于
-20
℃保存;
请提供
total
RNA
样品具体浓度、体
积、制备时间、溶剂名称及物种来源。请
同时附上
QC
数据,包括电泳胶图、分光光度或
Nanodrop
仪
器检测数据。
(
4
)样品
请置于
1.5 ml
管中,管上注明样品名称、浓
度以及制备时间,管口使用
Parafilm
封口。
建议使用干冰
运输,并且尽量选用较快的邮递方式,以降低运输过程中样
品降解的可能性。
mRNA
的纯化分离方法?
进行
mR
NA
研究中,首先需要对样本进行总
RNA
抽提,
抽提得到的
RNA
除含有<
/p>
mRNA
外,
还含有
rRNA
和
tRNA
,
为防
止这两类
RNA
对转
录组研究的影响,因此我们需要对
mRNA
进行分离纯化。真核
细胞的
mRNA
分子最显著的结构特征是
具有
5
’端帽子结构(
m7G
)和
3
’端的
Pol
y(A)
尾巴。绝大
多数哺乳类动物细胞
mRNA
的
3
’
端存在
20-30
个腺苷酸组成
3
百度文库
-
让每个人平等地提升自我
的
Poly
(
A
)尾,通
常用
Poly
(
A+
< br>)表示。这种结构为真核
mRNA
的提取,提供了极为方
便的选择性标志,寡聚(
dT
)纤
维素
或寡聚(
U
)琼脂糖亲合层析分离纯化
mRNA
的理论基础
就在于此。
mR
NA
的分离方法较多,其中以寡聚(
dT
)
-
纤维
素柱层析法最为有效,已成
为常规方法。此法利用
mRNA 3
’
末端含有
Poly
(
A+
)的特点,在
RNA
流经寡聚(
dT
)纤维素
柱时,在高盐缓冲液的作用下,
mRNA
被特异地结合在柱上,
当逐渐降低盐的浓度
时或在低盐溶液和蒸馏水的情况下,
mRNA
被洗脱,经过两次
寡聚(
dT
)纤维柱后,即可得到较高
纯度的
mRNA
。
使用
So
lexa
进行转录组测序时,样本
RNA
如何进行片
段化处理?
cDNA
插入片段长度的选择?
Solexa
转录组测序文库构建时
采用专用的打断
Buffer
对
RNA
样本进行片段化处理,这种方法充分利用
RNA
对二价
阳离子的敏感性,具有稳定性好的优点,通过这种方法打断
能得到更加均匀的覆盖率。
mRNA-seq
可以既
可以采用单端测
序(
single
read
)
还可以采用双端测序(
paired end
)
,
对于单端测序来说片段长度
150-200bp
是理想的长度范围,
对于双端测序来说片
段长度推荐
300-500bp
,由于两端加入
了
Solexa
的锚定序列和引物序列,样品准备完成
后所获得
的产物长度比插入的
cDNA
长度要长。
4
百度文库
-
让每个人平等地提升自我
文库准备过程中,反转录引物的选择?
在进行
c
DNA
合成过程中,
经常用到的有两种引物:
< br>oligo
dT
引物和随机引物。
在
RNA
反转录过程中使用
oligo dT
引
物进行扩增可以
保证扩增产物包括
mRNA
的
3'
末端,
减少
rRNA
的干扰,
但是
采用<
/p>
oligo dT
引物扩增有一个问题,就是扩增片段的长度<
/p>
偏短和扩增产物所包含的信息量偏向
3
’
端的问题,之所以
有长度偏短,一方面与
RNA
完整性有关,但最重要的限制在
于逆转录酶的延伸能力。
用
oligo dT
引物扩增出来的片段长度短,虽然都有
p>
mRNA
的
3'
端
,但是序列信息多位于
3'-UTR
附近,若扩增序列太
短,则有用信息很少,不利于序列的识别和分析。
使用
Random
primer
扩增,虽然扩增偏短长度也很短,
但是由于它的逆转录并不一定在
mRNA
的末端起始
,而是在
随机位置起始,所以它的扩增片段带有更多
CDS
p>
的信息,但
是如果是用总
RNA
逆转录的话,
有可能会受到
rRNA
的干扰。
采用
Sole
xa
进行转录组测序,测序文库准备过程中,由于
实验之前已经
采用
oligo dT
微磁珠进行纯化,而且
< br>mRNA
已
经进行了片段化处理后才进行反转录,因此反
转录只能采用
随机引物进行
cDNA
的
合成,如果采用
oligo dT
进行扩增,
< br>只能得到
mRNA
的
3'
端序列,无法得到完整的
mRNA
序列。
p>
5
百度文库
-
让每个人平等地提升自我
Solexa
进行转录组测序,
p>
测序文库的制备方法及质控标
准?
首先会样本进行质量检测,检测合
格后,对样本进行测
序前处理,构建测序文库,构建步骤为:
(
1
p>
)首先利用
oligo dT
微珠纯化
p>
mRNA
;
(
2
)将纯
化得到的
mRNA
进行片段化处理;
(
3
p>
)利用逆转录酶反转录合成
cDNA
第一链
;
(<
/p>
4
)以
cDNA
第一链为模板合成双链
cDNA
;
(
5
p>
)对双链
cDNA
进行末端修复并在
3
’末端加’
A
”<
/p>
;
(
6
)在
DNA
p>
片段的两端连接上特定的测序接头;
(
7
)
p>
割胶纯化连接好的
cDNA
片段
(一般回收
200-500bp
之间的片段)
p>
;
(
8
)利用高保真聚合酶扩增测序文库;
(
9
)检测测序文库。对于测序文库,需要进行质量控
制,一般通过
Aligent
Technologies
2100
分析仪和电泳观
察两种方法检
测测序文库的大小,纯度及浓度。
转录组测
序结果的影响因素?
RNA
的
降解严重影响测序的质量,
RNA
降解后,加入
6
百度文库
-
让每个人平等地提升自我
poly-
A
后无法捕获纯化
mRNA
,因此,随
机引物反转录无法
得到全部的
cDNA
,导致测序结果出现明显的
3
‘
-
p>
和
5
’
-
偏
向。
文库中的
pol
y-A
多聚物的存在会对测序信号产生干扰,
影响测序结果的准
确性;同时由于转录组中转录本的丰度不
一致,实验前需要对样本进行均一化处理,否则
高丰度的表
达基因会掩盖低丰度表达基因,导致寻找新基因失败或者是
< br>获得大量无意义的重复序列。
转录组测序需要多大的测序量才能得到有意义的结
果?
转录组测序前,需要对物种转录组的大小进行评估,评
估方法如下:
(
1
)对于有
reference genome
p>
的物种,可以分析基因
组信息,统计编码基因的个数,及其碱基数,
从而估计物种
转录组的大小,另外可以查询相关或相近物种转录组研究的
文献,作为参考。
p>
(
2
)对于无
re
ference genome
的物种则只能参考相近
物种的转
录组大小。
由于转录组需要进行表达量的分析,因此在转录组测序
中不推荐覆盖度,在进行不同
基因和不同实验间的基因表达
差异分析时,人们提出了
RPM<
/p>
和
RPKM
的概念。
RPM
(
Reads
7
百度文库
-
让每个人平等地提升自我
Per
Million
reads
)
即每百万
reads
中来自于某基因的
reads
数,考虑了测序深度对读段计数的影响。
< br>RPKM
(
Reads Per
Kilo bases per Million reads
)是每百万
reads
中来自于
某基因
每千碱基长度的
reads
数。因此,在确定转录组的测
序量时,最好以产生的读长数目做依据,参照转录组大小,
估计需要的
读长数目,来确定转录组需要的测序量。
如何处理转录组测序中存在的系统噪音和偏差?
虽然深度测序技术的准确性较以前
的技术有了很大提
高,但仍然存在错误和噪声。比如内含子区内有一些不连续
的
reads
,很可能由系统噪声造成,如样品污
染、测序错误
和不恰当的
read
定位
策略等。另外,外显子区域内的
read
信号分布有时也很不均
匀。
有文献报道,
序列组成尤其是
GC
含量、
RNA
二级结构等也有可能是导
致
read
不均匀分布的原
因。这些噪
声和分布偏好将影响新基因的识别和对剪接异构
体形式和表达水平推断。
合理地建模
RNA-seq
数据中的系
统噪声和偏好是解决上
述问题最有效的办法。基本的思路可以是:首先根据实验原
理寻找可能产生系统噪音或偏差的因素,并尽可能将这些因
素转化成可
量化的特征,如序列特征、二级结构等;然后,
将用实验数据对这些特征做统计分析,构
造和训练模型,用
模型来对数据进行校正。需要注意的是,某些偏好是由当前
8
百度文库
-
让每个人平等地提升自我
的测序技术
和分析方法共同造成的,难以完全消除。在这种
情况下,后续处理和解释时需要充分意识
到这种偏好可能对
生物学结论带来的影响,必要时通过补充其他实验来验证和
修正通过高通量测序得到的生物结论。
葛博
XX
年
05
月
篇二:转录组测序
转录组分析
研究背景:
RNA-Seq
是通过结合实验和计
算方法来鉴定生物样品中
RNA
序列的种类和丰度的一种技术。
通过
RNA-seq
,我们就
能够确定
单链
RNA
分子中
ATCG
的顺序。
整个过程主要包括:
从细胞或组织中提取
RNA
分子、文库的构建以及后继的生物
信息学数据分析。
RNA-Seq
技术具有许多早期研究方法
(如:
微阵列)所不具备的优点,如:
RNA-Seq
平台的高通量、新
技术所带来的高灵敏度、发现
新转录本、新基因模型以及非
编码
RNA
的能力等。
RNA-Seq
技术的到来,使人们认识到,无论是单细胞模<
/p>
式生物还是人类,我们对其转录组的认知异常匮乏。而
RNA-
Seq
产生的新的数据,则可以帮助我们发现基因结构上
9
百度文库
-
让每个人平等地提升自我
的
巨
大
差
异
、
鉴
定
出
< br>新
的
转
录
本
以
及
能
够
对
small
non-coding
RNA
和
lncRNAs
有着更好的了解。而且随着测序
花费的降低,
RNA
-Seq
的优势体现的更加明显。
服务流程:
样品选取
mRNA
片段化
cDNA
合成
末端修复、
加
polyA
、
加接头,
PCR
扩增
数据分析
测序方案:
内容:
T
otalRNA
检测,
普通转录组文库构建及测序及信
息分析。
测序方式:
HiseqPE125
。
项目周期:有参
45
天,无参
50
天。
分析内容:
无参考基因组:
1.1
质量控制
1.11
评估碱基质量
1.12
过滤低质量
reads
1.13
去掉低质量碱基和接头序列
10