BLAST
1. 概述
基本本地比对搜索工具(Basic Local Alignment Search Tool, BLAST)是一种用于生物序列比对(Sequence Alignment)的算法,可快速在数据库中查找与给定核酸或蛋白序列相似的序列。BLAST 广泛用于基因组学、蛋白质结构预测、进化分析等生物信息学领域。
2. 主要算法原理
BLAST 采用启发式方法(Heuristic Method),通过以下步骤提高比对速度:
- 种子匹配(Seed Matching):从查询序列中提取短片段(称为“词”或 k-mer),在数据库中快速查找匹配项。
- 扩展比对(Extension):将匹配的短片段向两侧扩展,计算得分,保留高得分片段。
- 回溯(Traceback):应用 Smith-Waterman 或 Needleman-Wunsch 方法优化最终比对结果。
3. 主要类型
- BLASTN:用于核酸序列(DNA 或 RNA)比对。
- BLASTP:用于蛋白质序列比对。
- BLASTX:将核酸序列翻译成蛋白序列,并与蛋白数据库比对。
- TBLASTN:用蛋白序列比对翻译后的核酸数据库。
- TBLASTX:比较两个核酸序列,均翻译成蛋白后进行比对。
4. 重要统计指标
- E 值(Expectation Value, E-value):表示随机匹配的可能性,值越小越显著。
- 比对得分(Bit Score):衡量比对质量,值越高越可靠。
- 身份百分比(Identity Percentage):比对片段中相同残基所占比例。
5. 应用领域
- 基因注释:通过比对已知基因数据库,推测新序列的功能。
- 进化分析:研究物种间基因同源关系。
- 疾病研究:检测致病基因或突变。
- 药物开发:寻找蛋白靶点的同源蛋白。
6. 相关工具
- PSI-BLAST(位置特异性迭代 BLAST):适用于发现远缘同源蛋白。
- MEGABLAST:用于大规模基因组序列比对。
- BLAST+:改进版 BLAST,提高比对速度。
参考文献
(1)Altschul, S. F., Gish, W., Miller, W., et al. (1990). "Basic local alignment search tool." Journal of Molecular Biology, 215(3), 403–410.
(2)Camacho, C., Coulouris, G., Avagyan, V., et al. (2009). "BLAST+: architecture and applications." BMC Bioinformatics, 10, 421.
(3)Mount, D. W. (2004). Bioinformatics: Sequence and Genome Analysis (2nd ed.). Cold Spring Harbor Laboratory Press.
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。