昆虫线粒体基因组——组装、注释
昆虫线粒体基因组特点:
昆虫线粒体基因组大小一般在15000bp上下,不同种昆虫线粒体基因组大小等方面具有差异。其线粒体基因组一般包括(仅供参考):
13个蛋白质编码基因(PCGs):ND1、ND2、ND3、ND4、ND4l、ND5、ND6、COX1(COI)、COX2、COX3、ATP6、ATP8。
22个tRNA基因(较短,每个大小在50bp左右):trnP、trnI、trnY、trnT、trnV、trnW、trnS1、trnQ、trnS2、trnM、trnL2、trnK、trnD、trnG、trnN、trnE、trnH、trnA、trnF、trnL1、trnR、trnC.
两个蛋白质编码基因:16S(rrnL)、12S(rrnS)。
此外还具有富含AT的一段控制区以及其它非编码区。
昆虫线粒体基因组组装:
组装线粒体基因组的软件有很多,这里介绍MitoZ、Mitofinder、MEANGS、NOVOPlasty。
MitoZ
MitoZ截至2023年3月7日更新到了3.4,使用之前可用h/help命令查看帮助文档,MitoZ有不同运行模式,包括:组装、注释、或者全都要。
eg:
nohup python3 /home/curry/ZWZJ/mitoz-3.4/mitoz/MitoZ.py \
all --genetic_code 5 --clade Arthropoda --outprefix ZWZJ \
--thread_number 4 --fq1 /home/curry/ZWZJ/ZJ20010.clean.R1.fastq.gz \
--fq2 /home/curry/ZWZJ/ZJ20010.clean.R2.fastq.gz --fastq_read_length 150 \