注重体验与质量的电子书资源下载网站
分类于: 计算机基础 互联网
简介
生物信息学 豆 0.0分
资源最后更新于 2020-07-26 15:38:34
作者:伦盖威尔
出版社:化学工业出版社
出版日期:2006-01
ISBN:9787502584795
文件格式: pdf
标签: 算法 生物信息学 数据挖掘 pharmaceutics 统计学 机器学习
简介· · · · · ·
运用计算机对生物信息进行收集、处理、分析和模拟的生物信息学为药物的研究与开发过程带来了革新性的变化。本书原著由致力于生物信息学组件和算法研究的全球知名专家编写,从应用角度对生物信息学技术进行了阐述。本书分为两篇,第1篇为生物信息学的基础知识,对生物信息学研究
各环节应用的方法、软件和数据资源进行了说明;第2篇论述了 生物借慰学在撕药研究与开发中的应用。本书适用于药物研究与开发领域,生物学、生物化学专业的研究人员,同时可供药学专业的高年级本科生和研究生参考。
目录
1生物信息学:基因组到药物的桥梁3
11疾病的分子基础3
12疾病治疗的分子途径7
13寻找蛋白质靶点8
131基因组学与蛋白质组学10
132基因/蛋白质所能提供的信息10
14药物开发11
15生物信息学的概貌12
151生物信息学的内在属性14
16生物信息学的扩展属性16
161基本贡献:分子生物学数据库和基因组比较16
162应用之一:基因和蛋白质表达数据17
163应用之二:药物筛选18
164应用之三:遗传变异18
参考文献19
2序列分析20
21引言20
22序列分析21
221二级结构预测22
23双重序列比对24
231点阵作图法24
232序列比对25
24数据库检索 Ⅰ:单一序列的启发式算法28
25比对与相似性搜索的统计31
26多重序列比对33
27多重比对和数据库搜索35
28蛋白质家族和蛋白质结构域36
29结论37
参考文献37
3真核基因的结构、性质以及计算识别42
31真核基因的结构特点42
32哺乳类动物基因组中拼接位点的分类44
33识别功能信号的方法47
331搜寻保守序列的非随机的相似性47
332位点特异性识别器49
333内容特异性测定方法51
334基于框架特异性的蛋白编码区识别方法51
335精确性量度52
336线性辨识分析的应用52
337供体受体拼接位点的预测53
338人类DNA中启动子序列的识别56
339poly(A)位点的预测58
34基因识别方法61
35用于多基因预测的差异分析概率法61
351使用HMM的多基因预测方法62
352基于模式的多基因预测方法64
353基因识别程序的准确性67
354利用蛋白质或EST相似性信息来改进基因预测69
36基因组测序计划所产生序列的注释70
37InfoGene:已知基因和预测基因的数据库72
38预测的基因功能分析和确证74
39基因发现与功能位点预测的常用网址76
致谢76
参考文献77
4分析基因组中的调控区域82
41真核基因组中调控区域的主要特征82
42调控区域的主要功能82
421转录因子结合位点(TF位点)83
422序列特征83
423结构元件83
424调控区域的组织原则83
425用于分析和检查调控区域的生物信息学模型87
43元件检测的方法88
431转录因子结合位点的检测88
432结构元件的检测89
433其他元件的检测89
44调控区域的分析90
441训练集的选择90
442统计学和生物学显著性90
443上下文依赖性91
45调控区域的检测方法91
451调控区域的类型92
452调控序列的识别方法93
46大的基因组序列分析97
461灵敏度与特异性的平衡98
462长的上下文序列98
463比较基因组学的特征99
464基于高通量方法的数据集分析99
47结论99
参考文献100
5生物学和医学中的同源模建103
51引言103
511同源模建的概念103
512同源蛋白是如何产生的?104
513同源模建的目的105
514基因组计划的影响106
52数据输入107
53方法109
531在不同层次的复杂性上模建109
532环模建110
533侧链模建119
534完整模建的方法127
54结果129
541靶蛋白的范围129
542举例:淀粉状前体蛋白β分泌酶130
55优势和局限性134
56检验135
561侧链预测的精度135
562CASP会议136
563蛋白质健康度137
57可获得性139
58附录139
581骨架构象139
582侧链构象分析145
致谢149
参考文献149
6蛋白质结构预测163
61概述164
611术语的定义166
612本章所涉及的内容167
62数据169
621输入数据169
622输出数据169
623其他输入数据169
624结构比较和分类170
625评分函数和(经验)能量势172
63方法175
631二级结构预测175
632基于知识的三维结构预测177
64结果189
641远缘同源检测189
642结构基因组学189
643为结构基因组学选择靶标194
644基因组注释196
645序列到结构到功能的范式(Paradigm)196
65预测的验证197
651基准集(Benchmark set)测试197
652盲法预测实验(CASP)199
66结论:优势和局限性201
661线串法201
662优势202
663局限性202
67获取方式203
致谢203
参考文献204
7药物设计中的蛋白质配体对接216
71引言216
711对接的分类217
712基于结构的药物设计的应用218
72蛋白质配体对接的方法219
721刚性结构对接219
722柔性配体对接算法223
723模拟对接228
724组合库的对接231
725蛋白质配体复合物计分232
73验证与应用234
731X射线结构的再造234
732盲法预测验证235
733筛选小分子数据库235
734组合库的对接237
74实际中的分子对接237
741输入数据的准备237
742分析对接结果238
743选择正确的对接工具238
75总结239
76可获取的软件240
致谢240
参考文献240
8蛋白质蛋白质和蛋白质DNA对接的模建248
81引言248
811蛋白质蛋白质和蛋白质DNA对接的必要性248
812计算方法概述248
813本章的范围250
82蛋白复合物的结构研究250
83蛋白质蛋白质对接的方法251
831用傅里叶相关理论来进行刚性结构对接251
832用残基对势为对接复合物再排序256
833距离限制的使用258
834复合物的精细化和附加筛选258
835对接的实现260
84蛋白质蛋白质对接的结果261
85蛋白质DNA复合物的模建264
851方法264
852结果265
86蛋白质蛋白质对接方案267
861对接模拟结果的评估267
862傅里叶关联法268
863其他刚性对接方法268
864柔性蛋白质蛋白质对接270
865用刚性处理法对假定的对接复合物重排名270
866在假定的对接复合物重排名过程中引入柔性271
87蛋白质蛋白质对接的盲法实验271
88蛋白质对接的能量方面273
89结论274
致谢275
参考文献275
第2篇应用
9分子生物学资源的集成与获取281
91引言281
92分子生物学资源282
921数据库282
922应用程序286
923全球范围的数据库与应用程序286
93SRS概述287
931元定义层288
932SRS核心288
933包封程序288
934客户端程序288
94集成分子生物学资源289
941SRS标记服务器289
942分子生物学资源的元定义290
943索引数据库291
944查询与链接数据库291
945浏览器和对象加载器291
946应用程序——分析数据292
95SRS数据仓库292
96访问集成数据293
961网页界面293
962应用程序的界面(API)295
963其他界面296
97其他方法296
98总结297
参考文献297
10基因组测序计划的生物信息学支持298
101引言298
102方法302
1021相似读序对的快速鉴定303
1022低质末端区的去除305
1023重叠区的计算和评估306
1024叠连群的构建306
1025一致序列的构建308
103示例308
104其他拼装程序313
105结论315
致谢315
参考文献315
11序列差异性分析317
111引言317
112序列差异性317
113连锁分析318
114关联分析320
115为什么由遗传分析转移到单核苷酸多态性?321
116SNP的发现321
117基因型定型技术323
118在人类基因组中SNP是频繁出现的并且其组织结构很复杂325
119混合池策略(Pooling Strategies)327
1110结论327
参考文献328
12蛋白质组分析332
121引言和原理332
122蛋白质分离336
1221实验方面:一种实验操作技术——二维电泳技术的介绍336
1222应用二维电泳技术作为诊断学和疾病描述的工具337
123二维电泳图谱的计算机分析339
1231二维电泳分析软件341
124分离后蛋白质的验证和性质测定347
1241引言347
1242工具349
125蛋白质组数据库352
1251引言352
1252蛋白质序列数据库352
1253核酸序列数据库356
1254蛋白质家族、结构域及功能位点的数据库:InterPro357
1255二维电泳数据库357
1256翻译后修饰数据库358
1257结论359
126蛋白质组分析中的自动化359
1261引言359
1262应用肽质量指纹技术的机器化蛋白质鉴定360
1263分子扫描362
1264其他技术364
127结论365
参考文献366
13基因组和蛋白质组中靶标的搜寻369
131引言369
132大规模基因表达研究和药物靶点鉴定的实验设计369
133药物靶点发现中的计算分析372
1331Shannon 熵372
1332聚类374
1333分析方法联合应用于实验药物的开发377
1334如何选择这些方法378
1335未来展望:遗传网络的逆向工程378
1336基因组和蛋白质组380
134结论380
参考文献380
14数据库的筛选382
141引言382
142计算机虚拟筛选的方法384
1421基于配体相似性的虚拟筛选384
1422基于结构的虚拟筛选387
143虚拟筛选应用389
144第一个测试方案:快速相似性筛选算法的应用389
1441库生成389
1442计算细节391
1443筛选结果的讨论391
145第二个测试方案:对接作为一种虚拟筛选工具397
1451库生成398
1452对接程序398
1453对接结果讨论398
146总结和展望402
致谢403
参考文献403
15未来方向407
151基因组学和生物信息学的进展将如何改变我们对生物学
和医学的观点?407
152生物信息学将面临的主要挑战是什么?409
1521新的实验数据409
1522新的分析方法411
1523生物学上的整合观点413
153生物信息学的展望和内在局限性416
参考文献417
附录生物信息学中算法术语词表419
第2篇应用
第9章1
第2章药物开发过程27
本书适用于药物研究与开发领域,生物学、生物化学专业的研究人员,同时可供药学专业的高年级本科生和研究生参考。
11疾病的分子基础3
12疾病治疗的分子途径7
13寻找蛋白质靶点8
131基因组学与蛋白质组学10
132基因/蛋白质所能提供的信息10
14药物开发11
15生物信息学的概貌12
151生物信息学的内在属性14
16生物信息学的扩展属性16
161基本贡献:分子生物学数据库和基因组比较16
162应用之一:基因和蛋白质表达数据17
163应用之二:药物筛选18
164应用之三:遗传变异18
参考文献19
2序列分析20
21引言20
22序列分析21
221二级结构预测22
23双重序列比对24
231点阵作图法24
232序列比对25
24数据库检索 Ⅰ:单一序列的启发式算法28
25比对与相似性搜索的统计31
26多重序列比对33
27多重比对和数据库搜索35
28蛋白质家族和蛋白质结构域36
29结论37
参考文献37
3真核基因的结构、性质以及计算识别42
31真核基因的结构特点42
32哺乳类动物基因组中拼接位点的分类44
33识别功能信号的方法47
331搜寻保守序列的非随机的相似性47
332位点特异性识别器49
333内容特异性测定方法51
334基于框架特异性的蛋白编码区识别方法51
335精确性量度52
336线性辨识分析的应用52
337供体受体拼接位点的预测53
338人类DNA中启动子序列的识别56
339poly(A)位点的预测58
34基因识别方法61
35用于多基因预测的差异分析概率法61
351使用HMM的多基因预测方法62
352基于模式的多基因预测方法64
353基因识别程序的准确性67
354利用蛋白质或EST相似性信息来改进基因预测69
36基因组测序计划所产生序列的注释70
37InfoGene:已知基因和预测基因的数据库72
38预测的基因功能分析和确证74
39基因发现与功能位点预测的常用网址76
致谢76
参考文献77
4分析基因组中的调控区域82
41真核基因组中调控区域的主要特征82
42调控区域的主要功能82
421转录因子结合位点(TF位点)83
422序列特征83
423结构元件83
424调控区域的组织原则83
425用于分析和检查调控区域的生物信息学模型87
43元件检测的方法88
431转录因子结合位点的检测88
432结构元件的检测89
433其他元件的检测89
44调控区域的分析90
441训练集的选择90
442统计学和生物学显著性90
443上下文依赖性91
45调控区域的检测方法91
451调控区域的类型92
452调控序列的识别方法93
46大的基因组序列分析97
461灵敏度与特异性的平衡98
462长的上下文序列98
463比较基因组学的特征99
464基于高通量方法的数据集分析99
47结论99
参考文献100
5生物学和医学中的同源模建103
51引言103
511同源模建的概念103
512同源蛋白是如何产生的?104
513同源模建的目的105
514基因组计划的影响106
52数据输入107
53方法109
531在不同层次的复杂性上模建109
532环模建110
533侧链模建119
534完整模建的方法127
54结果129
541靶蛋白的范围129
542举例:淀粉状前体蛋白β分泌酶130
55优势和局限性134
56检验135
561侧链预测的精度135
562CASP会议136
563蛋白质健康度137
57可获得性139
58附录139
581骨架构象139
582侧链构象分析145
致谢149
参考文献149
6蛋白质结构预测163
61概述164
611术语的定义166
612本章所涉及的内容167
62数据169
621输入数据169
622输出数据169
623其他输入数据169
624结构比较和分类170
625评分函数和(经验)能量势172
63方法175
631二级结构预测175
632基于知识的三维结构预测177
64结果189
641远缘同源检测189
642结构基因组学189
643为结构基因组学选择靶标194
644基因组注释196
645序列到结构到功能的范式(Paradigm)196
65预测的验证197
651基准集(Benchmark set)测试197
652盲法预测实验(CASP)199
66结论:优势和局限性201
661线串法201
662优势202
663局限性202
67获取方式203
致谢203
参考文献204
7药物设计中的蛋白质配体对接216
71引言216
711对接的分类217
712基于结构的药物设计的应用218
72蛋白质配体对接的方法219
721刚性结构对接219
722柔性配体对接算法223
723模拟对接228
724组合库的对接231
725蛋白质配体复合物计分232
73验证与应用234
731X射线结构的再造234
732盲法预测验证235
733筛选小分子数据库235
734组合库的对接237
74实际中的分子对接237
741输入数据的准备237
742分析对接结果238
743选择正确的对接工具238
75总结239
76可获取的软件240
致谢240
参考文献240
8蛋白质蛋白质和蛋白质DNA对接的模建248
81引言248
811蛋白质蛋白质和蛋白质DNA对接的必要性248
812计算方法概述248
813本章的范围250
82蛋白复合物的结构研究250
83蛋白质蛋白质对接的方法251
831用傅里叶相关理论来进行刚性结构对接251
832用残基对势为对接复合物再排序256
833距离限制的使用258
834复合物的精细化和附加筛选258
835对接的实现260
84蛋白质蛋白质对接的结果261
85蛋白质DNA复合物的模建264
851方法264
852结果265
86蛋白质蛋白质对接方案267
861对接模拟结果的评估267
862傅里叶关联法268
863其他刚性对接方法268
864柔性蛋白质蛋白质对接270
865用刚性处理法对假定的对接复合物重排名270
866在假定的对接复合物重排名过程中引入柔性271
87蛋白质蛋白质对接的盲法实验271
88蛋白质对接的能量方面273
89结论274
致谢275
参考文献275
第2篇应用
9分子生物学资源的集成与获取281
91引言281
92分子生物学资源282
921数据库282
922应用程序286
923全球范围的数据库与应用程序286
93SRS概述287
931元定义层288
932SRS核心288
933包封程序288
934客户端程序288
94集成分子生物学资源289
941SRS标记服务器289
942分子生物学资源的元定义290
943索引数据库291
944查询与链接数据库291
945浏览器和对象加载器291
946应用程序——分析数据292
95SRS数据仓库292
96访问集成数据293
961网页界面293
962应用程序的界面(API)295
963其他界面296
97其他方法296
98总结297
参考文献297
10基因组测序计划的生物信息学支持298
101引言298
102方法302
1021相似读序对的快速鉴定303
1022低质末端区的去除305
1023重叠区的计算和评估306
1024叠连群的构建306
1025一致序列的构建308
103示例308
104其他拼装程序313
105结论315
致谢315
参考文献315
11序列差异性分析317
111引言317
112序列差异性317
113连锁分析318
114关联分析320
115为什么由遗传分析转移到单核苷酸多态性?321
116SNP的发现321
117基因型定型技术323
118在人类基因组中SNP是频繁出现的并且其组织结构很复杂325
119混合池策略(Pooling Strategies)327
1110结论327
参考文献328
12蛋白质组分析332
121引言和原理332
122蛋白质分离336
1221实验方面:一种实验操作技术——二维电泳技术的介绍336
1222应用二维电泳技术作为诊断学和疾病描述的工具337
123二维电泳图谱的计算机分析339
1231二维电泳分析软件341
124分离后蛋白质的验证和性质测定347
1241引言347
1242工具349
125蛋白质组数据库352
1251引言352
1252蛋白质序列数据库352
1253核酸序列数据库356
1254蛋白质家族、结构域及功能位点的数据库:InterPro357
1255二维电泳数据库357
1256翻译后修饰数据库358
1257结论359
126蛋白质组分析中的自动化359
1261引言359
1262应用肽质量指纹技术的机器化蛋白质鉴定360
1263分子扫描362
1264其他技术364
127结论365
参考文献366
13基因组和蛋白质组中靶标的搜寻369
131引言369
132大规模基因表达研究和药物靶点鉴定的实验设计369
133药物靶点发现中的计算分析372
1331Shannon 熵372
1332聚类374
1333分析方法联合应用于实验药物的开发377
1334如何选择这些方法378
1335未来展望:遗传网络的逆向工程378
1336基因组和蛋白质组380
134结论380
参考文献380
14数据库的筛选382
141引言382
142计算机虚拟筛选的方法384
1421基于配体相似性的虚拟筛选384
1422基于结构的虚拟筛选387
143虚拟筛选应用389
144第一个测试方案:快速相似性筛选算法的应用389
1441库生成389
1442计算细节391
1443筛选结果的讨论391
145第二个测试方案:对接作为一种虚拟筛选工具397
1451库生成398
1452对接程序398
1453对接结果讨论398
146总结和展望402
致谢403
参考文献403
15未来方向407
151基因组学和生物信息学的进展将如何改变我们对生物学
和医学的观点?407
152生物信息学将面临的主要挑战是什么?409
1521新的实验数据409
1522新的分析方法411
1523生物学上的整合观点413
153生物信息学的展望和内在局限性416
参考文献417
附录生物信息学中算法术语词表419
第2篇应用
第9章1
第2章药物开发过程27
本书适用于药物研究与开发领域,生物学、生物化学专业的研究人员,同时可供药学专业的高年级本科生和研究生参考。