ncbi blast结果怎么看 中间黑线什么意思

温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!&&|&&
LOFTER精选
网易考拉推荐
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
阅读(1228)|
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
历史上的今天
loftPermalink:'',
id:'fks_086066',
blogTitle:'NCBI工具:BLAST 2 Sequences的用法',
blogAbstract:'来源:柳城博客:
{if x.moveFrom=='wap'}
{elseif x.moveFrom=='iphone'}
{elseif x.moveFrom=='android'}
{elseif x.moveFrom=='mobile'}
${a.selfIntro|escape}{if great260}${suplement}{/if}
{list a as x}
推荐过这篇日志的人:
{list a as x}
{if !!b&&b.length>0}
他们还推荐了:
{list b as y}
转载记录:
{list d as x}
{list a as x}
{list a as x}
{list a as x}
{list a as x}
{if x_index>4}{break}{/if}
${fn2(x.publishTime,'yyyy-MM-dd HH:mm:ss')}
{list a as x}
{if !!(blogDetail.preBlogPermalink)}
{if !!(blogDetail.nextBlogPermalink)}
{list a as x}
{if defined('newslist')&&newslist.length>0}
{list newslist as x}
{if x_index>7}{break}{/if}
{list a as x}
{var first_option =}
{list x.voteDetailList as voteToOption}
{if voteToOption==1}
{if first_option==false},{/if}&&“${b[voteToOption_index]}”&&
{if (x.role!="-1") },“我是${c[x.role]}”&&{/if}
&&&&&&&&${fn1(x.voteTime)}
{if x.userName==''}{/if}
网易公司版权所有&&
{list x.l as y}
{if defined('wl')}
{list wl as x}{/list}非常详细的NCBI网站里的blast比对服务的使用教程
简介:非常详细的NCBI网站里的blast比对服务的使用教程。
大小:3174.0 KB需要消耗1个丁当
已有74685位站友通过上传文件赚到了2564930个丁当
相关推荐文档
(请与我们联系:微信号dingxiangwang 或点此扫一扫)
该文档由会员上传,版权问题请查看
丁香园文件上传协议
丁香文档是供丁香园网友在线分享文章、书籍、课件、图片、视频、软件等资源的开放平台,为网友提供的信息存储空间。平台上所累积的文档均来自热心用户的积极上传。丁香园未经授权不编辑或修改用户上传的文档。对于用户上传的文档内容之真实性引发的全部责任,由用户自行承担。丁香文档的用户不能侵犯包括他人的著作权在内的知识产权以及其他权利。一旦由于用户上传的文档、书籍、视频等发生权利纠纷或侵犯了任何第三方的合法权益,其责任由用户本人承担,因此给丁香园或任何第三方造成损失的,用户应负责全额赔偿。
丁香文档用户不得侵犯包括他人的著作权在内的知识产权以及其他合法权利。如果由于用户上传的文档、视频等未经著作权人同意擅自对他人的作品进行全部或部分复制,修改,改编,翻译,汇编等,有可能侵害到他人的著作权时,不得把相关内容上传发布到丁香文档。
丁香文档的用户可以为介绍、评论、研究等目的,在合理的范围内适当引用他人已经发表的作品,但应当注明作者姓名、作品名称,并不得侵犯著作权人及其他权利人的合法权益。
用户需承诺其所上传的所有文档、视频等内容符合中国法律法规和规范性文件的相关规定,不侵犯任何第三方的合法权益。如用户违反前述保证,丁香文档有权删除相关文档内容,并可以暂停或终止向该用户提供服务。
对于用户上传到丁香文档上的任何内容,用户同意丁香园在全世界范围内享有免费的、永久的、不可撤销的、非排他性的使用和再许可的权利。丁香园享有修改、复制、发行、展览、信息网络传播、改编、翻译、汇编等权利。同时,对于用户上传到丁香文档内容的侵权行为,用户授权丁香园在全世界范围内进行维权。
如因丁香文档用户上传的内容侵犯了第三方的合法权利,第三方向丁香园提出异议,丁香文档有权删除相关的内容。
用户从丁香文档中获得的信息,未经事先许可,用户不得以盈利为目的自己或提供给第三方进行使用(符合法律规定的“合理使用”条件的除外)。否则,一切法律后果由该用户或第三方自负,与丁香园无关。
未经丁香园公司事先许可,禁止使用任何机器人、蜘蛛、其他自动设备,或手动程序来监视或复制丁香文档网页或其所包含的任何内容。否则,丁香园有权依法追究法律责任。
本协议未涉及的问题参见国家有关法律法规。当本协议与国家法律法规冲突时,以国家法律法规为准。
本网站之声明以及其修改权、更新权及最终解释权均属丁香园网站所有。丁香园有权根据互联网的发展和中华人民共和国有关法律、法规及规范性文件的变化,不断修改和完善相关条款。任何未尽事宜,请与我们联系:微信号dingxiangwang 或点此扫一扫
请选择举报原因
资源侵权(该资源侵犯我个人或公司的权益)
病毒资源(该资源有病毒)
名不副实(该资源标题与实际文件不相符)
广告(文件中有大量广告链接)
其他,请输入
关于丁香园查看: 5524|回复: 6
NCBI 2.2.24以上版本本地blast
注册时间 最后登录
秀基因 个 秀蛋白 个
各位:谁有NCBI 2.2.24以上版本本地blast的参数,希望多多提供啊。尤其是tblastn方面的。谢谢
注册时间 最后登录
秀基因 个 秀蛋白 个
楼主可以参看以下:
Windows平台下新版blast(2.2.24+)本地化构建+数据库下载+序列间的相似性检索&&
从blast-2.2.23-ia32-win32这个版本开始,本地化blast的参数有了很大改变, NCBI新近对 blast 程序做了一些修改推出了 blast+,目前最新版本为ncbi-blast-2.2.24+-ia32-win32。与之前的blast相比,新的blast+将blastn,blastx等合作与blastall命令分隔开来,对各个命令的参数定制更加方便而网上相关的一些教程大同小异,一部分操作已经不适用了,遂整理如下,仅供参考,不当之处,敬请指正。
blast+的本地化构建
1.1程序下载 链接到:
下载最新的BLAST+程序包,推荐版本(绿色版windows32位系统), 其他版本:适用于windows32位系统,ncbi-blast-2.2.24+-win64.exe 适用 Windows 64 位系统,请注意选择。
1.2安装流程
建议安装在非系统盘,如将下载的 BLAST 程序安装到 E:\blast,生成 bin、doc 两个子目录,其中 bin 是程序目录,doc是文档目录,这样就安装完毕了。
7300101.jpg (29.02 KB, 下载次数: 15)
12:45 上传
1.3用户环境变量设置
右键点击“我的电脑”-“属性”,然后选择“高级系统设置”标签-“环境变量”(图1),在用户变量下方“Path”随安装过程已自动添加其变量值,即“E:\Blast\bin”。 此时点击“新建”-变量名“BLASTDB”,变量值为“E:\Blast\db”(即数据库路径,图2)。
2878873.jpg (35.87 KB, 下载次数: 8)
12:45 上传
6748316.jpg (37.21 KB, 下载次数: 7)
12:45 上传
1.4查看程序版本信息
点击 Windows 的“开始”菜单,输入“cmd”(XP系统在运行中输入cmd)(图3)调出 MS-DOS 命令行,转到 Blast 安装目录,输入命令“blastn -version”即可查看版本(图4):
1555069.jpg (7.97 KB, 下载次数: 7)
12:45 上传
3011720.jpg (6.6 KB, 下载次数: 9)
12:45 上传
看到图4显示说明本地blast已经安装成功。
2.blast+本地数据库的构建
2.1 数据的获取
法 1:直接从 NCBI或者其他数据库网站下载所需序列做成数据库,或者自己已有的测序数据(格式必须是 fasta,名字可以自己随便命名,具体做法下面有说明 )。
法 2:从NCBI中的 ftp 库下载所需要的某一个库或几个库,其链接为其中 nr.gz 为非冗余的数据库,nt.gz 为核酸数据库,month.nt.gz 为最近一个月的核酸序列数据。下载的month.nt.gz先用winrar解压缩,然后用makeblastdb.exe格式化。
法 3:利用新版 blast自带的 update_blastdb.pl进行下载,这需要安装 perl 程序。
上述三种方法各有优缺点,前两种下载速度较快,但是每次进行检索都需要对数据库进行格式化(转化成二进制数据),第三种方法下载速度较慢,但是是 NCBI 中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。
2.2数据的格式化
本文以ratwy.fasta作为查询序列,以rat.fasta作为数据库文件为例进行讲解。首先将rat.fasta放到E:\blast\db文件夹下,然后调出MS-DOS命令行,转到E:\blast\db文件夹下运行以下命令:
格式化rat.fasta命令:makeblastdb.exe -in rat.fasta -parse_seqids -hash_index -dbtype prot
-in参数后面接将要格式化的数据库,-parse_seqids, -hash_index两个参数一般都带上,主要是为blastdbcmd取子序列时使用,-dbtype&&后接所格式化的序列的类型,核酸用 nucl,蛋白质用prot;如图
3011729.jpg (42.53 KB, 下载次数: 9)
12:45 上传
至此,本地数据库已经建立完毕!!!
3.序列间的相似性检索
BLAST+系列程序均要求查询序列以fasta格式存在,fasta格式已经程序事实上的序列标准被广泛采用,几乎所有的序列处理程序都要求fasta格式。所谓FASTA格式是指DNA序列第一行开始于一个标识符:&&&,紧接着(没有空格)是对该序列的唯一描述(即ID),然后一个空格,接着是对该序列的描述(也可以没有),从第二行开始就是一行行的序列,中间的空格,换行没有影响。为了方便阅读,每一行序列最好不要超过80个字母。详细的说明请看着这里 。
本文以ratwy.fasta作为查询序列,以rat.fasta作为数据库文件为例进行讲解。首先将ratwy.fasta放到E:\blast文件夹下,然后调出MS-DOS命令行,转到E:\blast文件夹下运行以下命令:
blastp.exe -task blastp -query rat1.fasta -db rat.fasta -out text.txt
相关参数说明:blastp.exe&&程序执行命令,exe 前的程序根据自己的需要而换;
-task&&后面选择你所要用的程序,blastn,blatp,tblastx 等;
-query&&后接查询序列的文件名称;
-db&&后接格式化好的数据库名称;
-out&&后接要输出的文件名称及格式; 如图:
921855.jpg (9.22 KB, 下载次数: 4)
12:45 上传
比对结束后可在blast文件夹下查看结果,本文存结果的文件名为ratwy_rat.txt。
4.从格式化本地数据库到序列比对如图:
6491238.jpg (56.19 KB, 下载次数: 12)
12:45 上传
核酸的比对与蛋白质相似,用blastn.exe。
blastn 的相关命令参数可用 blastn –help 命令查询,blastp 的相关命令参数可用 blastp –help查询,依次类推,如图。这里面有很多参数,比上网找参数的意义省事的多,这个就得自己研究吧!
3658018.jpg (76.44 KB, 下载次数: 9)
12:45 上传
另外新版blastn还有一个可以定制输出结果的参数-outfmt,有了这个参数,BioPerl、 Biopython中的blast解析器就可以不必使用了。这确实又是BLAST+新版另外一个最大的提高,非常非常方便。本人的一些工作就依赖于BLAST结果的解析,有了这个参数,就不需要解析BLAST结果了,确实很好很强大。具体如何使用,各位可以摸索一下,非常简单。
希望各位朋友将自己的经验分享以将 blast 越用越好。
附:以下来自于网友
个人在使用blastn的过程中总结了一些自认为常用的参数,总结如下:
blastn -db database_name -query input_file -out output_file -evalue evalue -max_target_seqs num_sequences -num_threads int_value -outfmt format format_string
blastn -db database_name -query input_file -out output_file -evalue evalue -max_target_seqs num_sequences -num_threads int_value -outfmt format &7 qacc sacc evalue length pident&
blastn -db plant_rna -query test.fa -out test.out -evalue 0.00001 -max_target_seqs 5 -num_threads 4 -outfmt format &7 qacc sacc evalue length pident&
blastn:这个不用说了吧,核酸对核酸的比对
-db: 指定blast搜索用的数据库,详见上篇文章
-query:用来查询的输入序列,fasta格式
-out:输出结果文件
-evalue: 设置e值cutoff
-max_target_seqs:设置最多的目标序列匹配数(以前我都用-b 5 -v 5,理解不对请指教)
-num_threads:指定多少个cpu运行任务(依赖于你的系统,同于以前的-a参数)
-outfmt format &7 qacc sacc evalue length pident& :这个是新BLAST+中最拉风的功能了,直接控制输出格式,不用再用parser啦, 7表示带注释行的tab格式的输出,可以自定义要输出哪些内容,用空格分格跟在7的后面,并把所有的输出控制用双引号括起来,其中qacc查询序列的acc,sacc表示目标序列的acc,evalue即是e值,length即是匹配的长度,pident即是序列相同的百分比,其他可用的特征(红色字体)如下:
*** Formatting options
-outfmt &String&
alignment view options:
0 = pairwise,
1 = query-anchored showing identities,
2 = query-anchored no identities,
3 = flat query-anchored, show identities,
4 = flat query-anchored, no identities,
5 = XML Blast output,
6 = tabular,
7 = tabular with comment lines,
8 = Text ASN.1,
9 = Binary ASN.1
10 = Comma-separated values
Options 6, 7, and 10 can be additionally configured to produce
a custom format specified by space delimited format specifiers.
The supported format specifiers are:
qseqid means Query Seq-id
qgi means Query GI
qacc means Query accesion
sseqid means Subject Seq-id
sallseqid means All subject Seq-id(s), separated by a ';'
sgi means Subject GI
sallgi means All subject GIs
sacc means Subject accession
sallacc means All subject accessions
qstart means Start of alignment in query
qend means End of alignment in query
sstart means Start of alignment in subject
send means End of alignment in subject
qseq means Aligned part of query sequence
sseq means Aligned part of subject sequence
evalue means Expect value
bitscore means Bit score
score means Raw score
length means Alignment length
pident means Percentage of identical matches
nident means Number of identical matches
mismatch means Number of mismatches
positive means Number of positive-scoring matches
gapopen means Number of gap openings
gaps means Total number of gaps
ppos means Percentage of positive-scoring matches
frames means Query and subject frames separated by a '/'
qframe means Query frame
sframe means Subject frame
When not provided, the default value is:
'qseqid sseqid pident length mismatch gapopen qstart qend sstart send
evalue bitscore', which is equivalent to the keyword 'std'
Default = `0'
注册时间 最后登录
秀基因 个 秀蛋白 个
aries42 发表于
楼主可以参看以下:
Windows平台下新版blast(2.2.24+)本地化构建+数据库下载+序列间的相似性检索&&
谢谢你,很完整。感谢
注册时间 最后登录
秀基因 个 秀蛋白 个
想请教你一个问题,我用的版本是BLAST-2.2.29+。在用blast的时候总是出现如图的情况,请问你可以帮助解决吗?我想大概可能是我之前用过bioedit做过本地比对,但是我后面卸载了这个软件,而且环境设置里路径也确认了是blast下的bin。非常感谢!!!
(44.27 KB, 下载次数: 7)
17:36 上传
注册时间 最后登录
秀基因 个 秀蛋白 个
您好,我现在使用blast也遇到了这个问题,不知您是怎么解决的?多谢
注册时间 最后登录
秀基因 个 秀蛋白 个
楼主可以参看以下:
Windows平台下新版blast(2.2.24+)本地化构建+数据库下载+序列间的相似性检索&&
你好,请问数据库fasta格式下载之后,改怎么格式化成二进制的格式呀?
生物秀精品推荐 /1
生物秀人才网【】上线!打造生物医药招聘专业平台!欢迎各位秀友创建自己的简历加入高端人才库,生物企业发布自己的招聘。
Powered by|/|/|/|/|/|
//|//|//|//|//|
NCBI中的blast如何使用 谢谢大家了
最近需要合成引物,可是公司要求提供基因的原始序列,请问各位基因的原始序列是什么啊?还有NCBI中的blast该如何使用啊,我找了好多地方都找不到关于它的详细说明你为什么不直接问公司什么是“基因的原始序列”呢?我想他们要的就是你设计引物时用到的基因序列吧。另外你为什么不直接问用过blast的人,跟他们直接学习一下不是更快吗。你的求助在“学习交流区”的“计算机”版块里的“生物医学软件应用”子版里发比较容易得到帮助。在该版块里面搜索可以得到别人跟你同样目的的帖子哦。(求:关于BLAST 的详细使用说明)进行序列比对的软件有很多,在上述版块里你可以找到很多建议的。谢谢小猪:)你要合成引物,是想检测还是扩出目的片段?如果检测,那么你要检测的基因序列就是原始序列;如果要扩增,这个目的片段就是原始序列喽。觉得你提的这个问题有点怪怪的。BLAST的方法很多,NCBI的最简单好用,把两个基因序列粘进去,一点BLAST就OK了,多序列比对可用的小软件就更多了,DNASTAR小有一些麻烦,暂时不推荐你用。
您的位置: &&}

我要回帖

更多关于 ncbi本地blast 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信