CrisprOpenDB是一个命令行宿主预测工具,用于对大量噬菌体基因组进行预测,并提供更定制化的宿主预测过程。该方法在以下论文中描述,并在发表的研究中引用:
Moïra B Dion, Pier-Luc Plante, Edwige Zufferey, Shiraz A Shah, Jacques Corbeil, Sylvain Moineau, Streamlining CRISPR spacer-based bacterial host predictions to decipher the viral dark matter, Nucleic Acids Research, Volume 49, Issue 6, 6 April 2021, Pages 3127–3138, https://doi.org/10.1093/nar/gkab133
先决条件
首先,下载或克隆该存储库。最简单的方法是使用git clone https://github.com/plpla/CrisprOpenDB.git。
接下来,创建一个虚拟环境来运行该工具。可以使用初始目录中的conda_env.txt文件设置一个conda环境,并使用以下命令:
conda create -c conda-forge --name CrisprOpenDB_env --file conda_env.txt
不要忘记激活环境以使用它:conda activate CrisprOpenDB_env
。
现在可以安装该工具了:python setup.py install
。
要使用此程序,需要下载spacer数据库和sqlite文件,并解压缩文件到CrisprOpenDB/SpacersDB/目录中。请注意,文件相当大。压缩文件的下载大小约为800Mo。一旦解压缩,文件大小将约为600Mo用于s