blast本地blast比对,在利用makeblastdb建库后,运行无报错但就是找不到建库的结果怎么回事



它相当于以前的fastacmd.利用这个命令,可鉯从blast中获得你想要的信息:

可以从数据库中提取除gi号为的序列,并且以fasta格式存入文件(当然也可以以其它格式获得序列)

gi ID是许多用来标志序列的标識符中的一种.是数据库文件中普遍使用,通行有效的保持索引的形式所有来源于NCBI的序列都有一个gi号“gi|gi_identifier”.是绝对唯一的,而自己利用makeblastdb命令 构建的数据库中,利用以下三种标识符:

这些标识符的作用是区别于gi号在本数据库中使得序列标识符唯一在查询和比对中分辨query序列与subject序列,


-in 後接输入文件你要格式化的序列

-out 后接数据库名,自己起一个有意义的名字以后blast+搜索时要用到的-db的参数

-logfile 日志文件,如果没有默认输出到屏幕


作用: 核苷酸序列的比对以及结果分析

例子0: 最简单的使用格式

例子2: 常用的格式:

-outfmt 选择性输出的一些内容. 如 : 7 代表查询结果表格化并且带有注釋行. 而 qacc 以及 sacc等则是自定义的所需的信息.可供选择的信息选项详见 -outfmt参数.-outfmt直接触发分析程序,而不用另外使用分析程序了.


经过观察发现: 用于blastn的query序列使用 fasta格式即可. 而数据库则不能直接使用fasta格式.而且数据库实际上是一个文件夹,而非单个文件.

另一方面可以用blastdbcmd从数据库中获取信息


注意:自己苼成的数据库中序列命名有以下三种形式:

2)格式化数据库后创建三个主要的文件——库索引(indices),序列(sequences)和头(headers)文件生成的文件的扩展名分别昰:.pin、.psq、.phr(对蛋白质序列)或.nin、.nsq、.nhr(对核酸序列)。而其他的序列识别符和索引则包含在.psi和.psd(或.nsi和.nsd)中


test_db是自定义的数据库.利用自己的标識符"seq1",可以成功抽取了在数据库中标识符为 lcl|seq1 的序列.

在使用下载的数据库时同样可以使用gi ID 抽取序列.

}

我要回帖

更多关于 本地blast 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信