使用本地 nt 数据库对 reads 和 Trinity 结果进行 blast - 生信学习 | Zhou Xiaozhao = 小钊の笔记 = 前天是小兔子，昨天是小鹿，今天是你

上个笔记中，进行了共生物种的确定，由于地下部位的转录组还有一部分 reads 没有比对上，可能是样品污染问题，也可能含有其他的物种，所以，想使用 Trinity 和为比对上的 reads 去比对到 nt 数据库查看结果

# nt 数据库下载和构建

	wget https://ftp.ncbi.nih.gov/blast/db/FASTA/nt.gz
	wget https://ftp.ncbi.nih.gov/blast/db/FASTA/nr.gz.md5
	md5sum nt.gz
	gunzip nt.gz
	nohup makeblastdb -in nt -parse_seqids -hash_index -dbtype nucl -logfile nt_logfile &

这样，nt 数据库就构建好了，后续的话利用这个数据库去确定物种

下载数据库和构建时间有点长，需要耐心等待

在运行 STAR 时，加入 --outReadsUnmapped Fastx 参数会将未比对的 reads 输出到文件，双端测序会生成 mate1 和 mate2 两个文件，利用该 reads 去 blast

	$cat S1-1Ufli.left.fa S1-1Ufli.right.fa>S1-1.reads.fa
	$cat S3-1fli.left.fa S3-1fli.right.fa>S3-1.reads.fa

	$nohup blastn -query S1-1.reads.fa -out S1-1.reads.blast -db /datadisk02/data/nt -outfmt 6 -evalue 1e-10 -num_threads 8 -qcov_hsp_perc 50.0 -num_alignments 5 2> blastn1-1.log &

	$nohup blastn -query S3-1.reads.fa -out S3-1.reads.blast -db /datadisk02/data/nt -outfmt 6 -evalue 1e-10 -num_threads 8 -qcov_hsp_perc 50.0 -num_alignments 5 2> blastn3-1.log &

在把未比对的 reads 进行 blast 之后，我又试着把未比对的 reads 用 Trinity 进行组装，并进行 blast

	$nohup Trinity --seqType fa --max_memory 50G --left S1-1Ufli.left.fa --right S1-1Ufli.right.fa --CPU 16 --output S1-1Ufli_trinity &

	$nohup Trinity --seqType fa --max_memory 50G --left S3-1fli.left.fa --right S3-1fli.right.fa --CPU 16 --output S3-1fli_trinity &

	$nohup blastn -query S1-1Ufli_trinity/Trinity.fasta -out S1-1.trinity.blast -db /datadisk02/data/nt -outfmt 6 -evalue 1e-10 -num_threads 8 -qcov_hsp_perc 50.0 -num_alignments 5 2> blastn1-1t.log &

	$nohup blastn -query S3-1fli_trinity/Trinity.fasta -out S3-1.trinity.blast -db /datadisk02/data/nt -outfmt 6 -evalue 1e-10 -num_threads 8 -qcov_hsp_perc 50.0 -num_alignments 5 2> blastn3-1t.log &

对于 blast 结果，主要是对比对到的基因进行汇总，去找哪个物种比对到的基因最多，涉及课题原因比对到的物种我就不在这里展示了。