生物信息学原理与方法dna序列分析与预测.pptx
- jianzhongdahong个人认证 |
- 2021-06-23 发布|
- 1.02 MB|
- 32页
生物信息学 原理与方法第一讲 DNA序列分析与预测; Biology;基因结构(内含子和外显子交界区符合gt-ag 规则);目录;一、DNA序列分析与预测的定义;二、软件资源;核酸序列数据库;第一步:获取DNA 目标序列
① 如果你已有目标序列,可直接进入第2 步;
② 可通过PubMed查找你感兴趣的资料;通过GenBank 或EMBL 等数据库查找目标序列。
第二步:查找ORF 并将目标序列翻译成蛋白质序列
利用相应工具,如ORF Finder 、Gene feature(Baylor College of Medicine)、GenLang(University of Pennsylvania)等,查找ORF并将DNA序列翻译成蛋白质序列。;第三步:在数据库中进行序列搜索
可以利用BLAST 进行ORF 核苷酸序列和ORF 翻译的蛋白质序列搜索。
第四步:进行目标序列与搜索得到的相似序列的全局配对(global alignment)
虽然第三步已进行局部配对(local lignment)分析,但全局配对有助于进一步加深目标序列的认识。
;第五步:查找基因家族
进行多序列比对(multiple sequence alignment)和获得配对区段的可视信息。可分别在AMAS(Oxford University)和BOXSHADE (ISREC,Switzerland)等服务器上进行。
第六步:查找目标序列中的特定模序
① 分别在Procite 、BLOCK 、Motif 数据库进行profile 、模块(block)、模序(motif)检索;
② 对蛋白质序列进行统计分析和有关预测
;第七步:预测目标序列结构
可以利用PredictProtein(EMBL)、NNPREDICT (University of California)等预测目标序列的蛋白质二级结构。
第