关键词不能为空

当前您在: 大学查询网 > 高校介绍 >

铁道大学四方学院武汉大学生物信息学复习提纲

作者:高考题库网
来源:https://bjmy2z.cn/daxue
2020-12-07 17:12
tags:

邢昭林上大学吗-我被外甥操

2020年12月7日发(作者:邹浩)


1

算法和模型的相通性


?

算法是为了解决 一个特定问题而需要执行


的一系列步骤或指令。


?

模型是为了研究一个特定系统,通过抽象


和简化而建立的代表这个系统的一种模式。< /p>


~~都需要输入数据,且都能够输出数据。


算法是根据输入数据得出输出数据

——

问题的


解。


模型是根据输入数据得出输出数据,从而反映


其 所代表系统的特性。


2

Why

use

Unix


?

稳定性好

:

Over

25

years

in

industry

and


academia.


?


?


开放性好:

Suppor ting

possible

tasks

in


future.


Internet

上的操作系统:

< p>The

software

that


powers

the

Web

was

invented

in

Unix,

and


many

if

not

most

web

servers

runs

on

Unix


servers.


科学软件的载体:

Many

good-quality,


interesting and important scientific software


are written for Unix.


共享的乐园:

Many

programs

can

be


downloaded

and

installed

on

Unix

systems


for free.


更加具有同一性。


?

一方面,用蛋白质序列进行序列比对的灵


敏度高于用

D NA

序列进行序列比对的灵敏


度,从而有利于寻找和联系亲缘关系较远< /p>


的序列;


?

另一方面,仅仅进行蛋白质序列比对可 能


丢失与进化过程直接有关的一些信息。


5 cDNA

文库


?

提取出组织细胞的全部

mRNA

,在体外反转录


cDNA

,与适当的载体(如噬 菌体或质粒载


体)连接后转化受体菌,则每个细菌含有一段


cD NA

,并能繁殖扩增,这样包含着细胞全部


mRNA

信息 的

cDNA

克隆集合称为该组织细胞的


cDNA

文库。


?

一个

cDNA

文库中的某 两个克隆,可能来源于


同一种

mRNA

,也可能不是;可 能是全长,但


一般不是全长。















< br>查

























< br>互










线
















< br>以

























< br>术

























< br>空

























< br>卷

























< br>在























使



< br>其

























< br>度

























< br>工

























< br>处

























< br>对

























< br>保

























线

< br>处

























< br>要

























< br>保



线























< br>术

























线

< br>试

























< br>免

























< br>动

























< br>壁

























< br>卷
























线


< br>关

















线









< br>设



















线







< br>对

























< br>试

























< br>属

























< br>压












线














< br>电

























< br>部















线











< br>报

























< br>和

























< br>布



















线







< br>。

























< br>资








?


?


Linux


?

Linux is a free, open source version of Unix.


?

Linux

can

turn

an

ordinary

PC

into

a


powerful workstation.


Under

Linux,

inexpensive

PCs

regarded

as


“obsolete”

by

Windows

user

become

startlingly


flexible and useful workstations.


?

Linux is an excellent platform for developing


software.


3

计算机语言


编程灵活度上:

(越灵活越容易编,但越易出错)


Perl > Java


C

>

C++


执行效率上:


C > C++ > Java > Perl


4 DNA

序列比对与蛋白质 序列比对


由于遗传密码的简并性,蛋白质序列比

DNA

序 列


6

获得

cDNA

全长的步骤


1

)获得全长

cDNA

序列及其 信息(

1


?

获得序列:实验操作往往很 复杂,比如先


通过特殊的限制性方法构建全长

cDNA


库,再(根据已知的区段信息)筛选对应


此种

c DNA

的特定克隆;


?

获得序列信息:由于测序技术的限 制(一


次几百

bp

,一般很难直接测出 全长序列,


所以可能需要打断,测序,再拼接片段信


息。


2

)获得全长

cDNA

序列及 其信息(

2


?

获得序列信息:通过构建 普通的

cDNA


库,进行高通量自动测序,我们可以得 到


大量的序列片断信息。运用序列自动拼接


软件工具,拼接这些 片断信息,可以同时


推测多种全长

cDNA

序列信息。< /p>


?

获得序列:之后可以根据全长信息在实验


室中获 得实际序列(如设计

全长

引物,


PCR

筛选普通

cDNA

文库)


3

cDNA

克隆单次测序产生一个

EST


通过自动测序仪 对一个

cDNA

克隆单次测序很难产


生整个克隆序列信息 ,往往只能产生一个片断序列


信息,称为一个

EST

。也 可以说,应用自动测序仪


对一个

cDNA

克隆的一种

读法

产生一个

EST


这种读法可以从

5‘

端进行 ,也可以从

3’

端进行。



全< /p>









< p>
















后< /p>




1



4

)从

cDNA

文库测序产生 大量

EST


5

)用

ES T

拼接得到全长

cDNA

序列信息


运用序 列自动拼接工具,进行

EST

序列信息拼接,


可以同时获 得多种全长

cDNA

序列信息


7

EST

Expressed Sequence Tag

)的意义


?

它们是从

cDNA

测序产生的短序列信息,


根据两端有重叠序列的

EST

可以组装获得


全长的

cDNA

序列信息;


?

它们代表在特定组织或发育阶段表达的基


因,其相关分析是一种发现新基因和定位


基因的有效方法。

?

EST

分析


尽管

EST

< p>本身是不完整的甚至可能是不精


确的

DNA

序列,但

EST

分析将为确定全长


cDNA

、寻找 新基因和定位基因提供有价值


的线索


8

ES T

的特性


?

EST

序列中除了

< p>A

G

T

C

外,可能出现


模糊碱基(如未知碱基

N


?

EST

序列可能出现错误

,

其中插入或缺失将


导致翻译时读码框移位(

fr ame-shifts


错误率:

genome 1/10kb

EST 1/100.


?

在数据库中,

EST

数据 可能是高度冗余的


交叉覆盖,甚至一个

EST

序列可能是另


一个

EST

序列的 一个片断。


9

基因组信息的三个层次


?

染色体基因 组,或简称基因组,即生物


体内所有细胞中的遗传信息。-

>DNA


?

表达基因组,或称转录基因组,即细胞某


个特定生长阶段中基因组的表达部分。


>mRNA

< p>。


?

蛋白质组,反映细胞特性和功能的所有蛋


白质分子。

>

蛋白质。


10

序列分歧度

---

sequence

divergence

K

是一种


相异性指数。


?

DNA

序列分歧度:

设两个

DNA

序列的碱基差异值为

N< /p>

,序列长度


L

,则差异率

P

N/L

分歧度

——

K

-?


ln(1- 4P/3)


?

蛋白质序列分歧度:


要 考虑其密码子基础,区分同义变化(

K


S


)和< /p>


2


非同义变化(

K


A



11

最大似然法(

maximum likelihood method

< p>)


1

)评估所选定的进化树能够产生实际观察到的


数据的可能性:(基于置换)


2

)针对一个位点的进化,先把某种组合的核苷


酸置于进化树的内部结 点,根据取代函数计算每一


段进化的可能性,将所有段的这种可能性相加,得

< p>
到此进化树以此组合为进化途径产生此位点数据的


可能性;


3

)换组合,再算。将所有组合的这种可能性相


乘,得到此进化树产生此位点数据的可能性;


4

)换 位点,再算。将所有位点的这种可能性相


加,得到此进化树产生此(序列组)数据的可能 性


(似然值)


5

< p>)换进化树,再评估。具有最大似然值(产生


此数据可能性最大)的进化树被认为是 最可能的实


际进化树。


12

构建系统树的各种方 法之比较


1

)假设


?

UPGMA

:各分支置换速率一致;序列较短


时易造成较大错误。


?

邻接法:依赖于距离系数的准确性;序列


短时 ,易有较大误差。


?

最大简约法:无明显假设;当序列间的分

< p>
歧度较大时,效果好,反之效果差。


?

最大似然法:对进化 速率和核苷酸置换型


式的假设十分明确,但对违背假设的情形


不 敏感(

Robust


2

)计算时间




< br>高

























< br>行

























< br>卷

























线

< br>,

























< br>试

























< br>气

























< br>高

























< br>置

























< br>进













使













< br>中

























< br>都

























< br>卷

























< br>范

























< br>校

























< br>况















线











< br>料

























< br>资


















线








< br>、

























< br>,















线











< br>以

























< br>;

























< br>气

























< br>高

























< br>并














线












< br>术







线



















< br>准









线

















< br>中

























< br>,

























< br>发

























< br>握


线
























< br>需

























< br>料





线





















< br>要

























< br>卷

























< br>料









线

















< br>范























<

<

<


3

)估计一致性(

Consistency


?

距离矩阵法

distance

matrix

met hod

:进化


速率恒定时一致;进化速率变化时不一致

< br>或难一致。


?

最大简约法

maximum parsimony method


不一致。


?

进化简约法:转换

/

颠换=

1

时 一致;反之


不然。



13

基因组大小


生物基因组大小和基因数目并不绝对成比例。


生物基因组大小与进化位置并不绝对相关。


14

结构基因组分析

——

基因组作图


?

Cytogeneti c maps


?

Genetic linkage maps


?

STS maps


?

RH maps


?

Clone-based maps


15

蛋白质组分析


1

)分离

--

双向凝胶电泳(

2D

gels


第一向:等电聚焦(

IEF

,蛋白质沿

pH

梯度分


离,至各自的等电点;


第二向:

SDS

电泳,按分子量分离。


2

2D

gels

分析

< p>*


?

图像分析:斑点位置和密度分析(包括斑


点分离、背景消减等工作)


?

斑点配比:同种斑点的 识别(蛋白差异表


达分析的前提)

< br>?

聚类分析:蛋白质表达矩阵。


3)

鉴定方法:< /p>


片段离子搜索

fragment ion searching


从头测序

de novo sequencing


肽质指纹分析(

Peptide-mass fi ngerprinting







< br>调

























< br>护


















线








< br>生

























< br>卷

























< br>料

























< br>下

























< br>试

























< br>敷






使




















< br>下

























< br>路

























< br>资

























< br>定

























< br>位

























< br>与








线


















< br>避

























< br>试











线















< br>置

























< br>试








线


















< br>系

























< br>决

























< br>。

























< br>进

























< br>用







线



















线

< br>保

























< br>对


线
























< br>压

























< br>调

























< br>需




















线






< br>内

























< br>家























线



< br>缆

























< br>用

























< br>现

























< br>接


线












?

最大似然法:一致性取决于建立似然函数


的进化模型。


4

)符合程度评价


(1)

计算机模拟:模拟进化,用以 评价构树方法的符


合程度。


A.

< p>进化速率恒定时:最大简约法≤邻接法≈最小


进化法;最大似然法依赖于进化模型。


B.

进化速率可变时:最大简约法≤邻接法<最大< /p>


似然法;

但当

转换

/

颠换

远大于

1

时,邻接法>


最大似然法。


(2)

实际进化:预先得到了实际的进化树(如实验室


控制进化)

,再来 检验分子构树的各种方法。克服


了计算机模拟中参数选定的主观性。

5

)一般构树方法选用策略


序列间有极高相似性:最大简约法。


序列间有较明显的相似性:距离矩阵法。


序列间没有较明显的相似性 :最大似然法。


肽质指纹分析原理


酶解拟鉴定蛋白质,测定实际 肽段质谱图;


从蛋白质数据库中随机挑选一段蛋白质序列,理论


酶解之,并计算出各个肽段的分子量,从而构建出


理论质谱图;


将实际肽段质谱图与此蛋白序列的理论质谱图进行


比较,进行相似性计分;


从数据库中重新挑选一段序列,重复以上两步;


最后,根据相似性计分从数据 库中寻找最可能的蛋


白序列。


4

)蛋白质组分的 自动化鉴定


高流通量筛选(

High throughout screening, HTS

):


机器人自动处理

——


转移双向凝胶图至

PVDF

膜、切割分离蛋白质组


分;

1.

控制酶解、传输至液相色谱分离、传输至质


谱测肽段质量;


2.

控制氨基酸组分分析;


自动搜索数据库进行蛋白质组分的鉴定。


?

< p>每天最小流量级达

1000

个蛋白质。


ExPASy--

综合性蛋白质信息服务器


16

生物信息学软件


?

学术途径:用于学术研究的软件一般可 以


免费或低费用获得。

——

自由软件

?

商业途径:商业开发的软件需支付相当的


费用,以获得产品和相应 服务。

——

商业


软件


自由软件的 特点


获得:免费或低费用,作者愿意共享。英特网是获


得自由软件的有效途径:有些可以直接通过浏览器


访问运行(如

Blast

Clustal

CAP3

等)

;有些要


下载(如

Phyl ip

,甚至在本地机器上编译。


使用 :一般是作为专门用途的单独程序或一组程序。


需要相当的熟练过程:用户必须熟悉输入

/

输出数


据的格式,学会有效地运行这些程序。尤其是进 行


多个程序的分析较为麻烦。


商业软件的特点


获得:一般价格比较昂贵,特别是作为多用户用途


的那些种类。 以光碟或网上付费的形式提供产品以


及相应的使用指南和升级服务。

使用:通常以集成功能的软件包形式开发。一般都


提供运行程序的友好环境,利于不 同功能的程序之


间的相互调用或顺序运作。


< br>全

























< br>后




3






















< br>资







甄欢耶鲁大学-高中三年计划


青岛大学留校-小时代观后感


相模原市大学-含有菊花的诗句


大学学制年限-感恩妈妈的作文


沈阳大学城妹子-程颢的诗


大学期间买房-冰心散文诗


潍坊民办大学-长生不老的近义词


大学入门课程-英语教师述职报告



本文更新与2020-12-07 17:12,由作者提供,不代表本网站立场,转载请注明出处:https://bjmy2z.cn/daxue/17766.html

武汉大学生物信息学复习提纲的相关文章