STAR 命令参数解释

以这个为例子解释STAR参数含义

STAR 命令参数解释

STAR \
--outFilterType BySJout \
--runThreadN 8 \
--outFilterMismatchNmax 2 \
--genomeDir <hg19_STARindex> \
--readFilesIn <un_aligned.fastq> \
--outFileNamePrefix <HEK293> \
--outSAMtype BAM SortedByCoordinate \
--quantMode TranscriptomeSAM GeneCounts \
--outFilterMultimapNmax 1 \
--outFilterMatchNmin 16 \
--alignEndsType EndToEnd
  1. --outFilterType BySJout:

    • 过滤类型,BySJout 表示只输出通过Splice Junction过滤的reads。这对于检测新的剪接位点非常有用。
  2. --runThreadN 8:

    • 使用8个线程进行计算。多线程可以加速处理速度,特别是在多核处理器上。
  3. --outFilterMismatchNmax 2:

    • 每个read允许的最大错配数。如果一个read有超过2个错配,则不会被输出。这个参数控制比对的精确度。
  4. --genomeDir <hg19_STARindex>:

    • 指定参考基因组索引的目录。这里假设是hg19基因组的STAR索引。
  5. --readFilesIn <un_aligned.fastq>:

    • 输入的FASTQ文件,包含待比对的reads。
  6. --outFileNamePrefix <HEK293>:

    • 输出文件的前缀。所有输出文件的名称都会以这个前缀开始。
  7. --outSAMtype BAM SortedByCoordinate:

    • 指定输出文件类型和排序方式。这里输出的文件格式为BAM,并按坐标排序。
  8. --quantMode TranscriptomeSAM GeneCounts:

    • TranscriptomeSAM:输出转录组的比对结果(适用于下游转录组分析工具)。
    • GeneCounts:生成基因计数文件。
  9. --outFilterMultimapNmax 1:

    • 每个read允许的最大多比对数(multimapping)。设为1意味着只保留唯一比对的reads。如果一个read比对到多个位置,则不会被输出。
  10. --outFilterMatchNmin 16:

    • 每个read的最小比对长度。如果一个read比对的长度小于16bp,则不会被输出。这个参数控制比对的质量。
  11. --alignEndsType EndToEnd:

    • 比对模式,EndToEnd 表示全长比对,要求read的两端都比对到参考基因组。

是否保留多比对(multimapping)

根据参数 --outFilterMultimapNmax 1,该设置表明只保留唯一比对的reads。如果一个read比对到多个位置,则不会被输出。因此,该命令配置没有保留多比对的reads,只有唯一比对的reads会被保留和输出。

总结

  • --outFilterMultimapNmax 1 参数设定为1,意味着不保留多比对的reads,只保留唯一比对的reads。
  • 其他参数控制比对的精确度、输出格式和质量过滤标准。

通过这些设置,STAR将只输出那些唯一比对到参考基因组的位置、且质量符合要求的reads。

相关推荐

  1. STAR 命令参数解释

    2024-07-10 21:00:03       27 阅读
  2. Linux命令stat命令

    2024-07-10 21:00:03       58 阅读
  3. am start 命令详解

    2024-07-10 21:00:03       28 阅读
  4. Python 命令参数解析库 docopt

    2024-07-10 21:00:03       37 阅读
  5. Rust 命令参数解析指南

    2024-07-10 21:00:03       32 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-10 21:00:03       100 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-10 21:00:03       107 阅读
  3. 在Django里面运行非项目文件

    2024-07-10 21:00:03       90 阅读
  4. Python语言-面向对象

    2024-07-10 21:00:03       98 阅读

热门阅读

  1. hid-ft260驱动学习笔记 4 - ft260_uart_ops

    2024-07-10 21:00:03       23 阅读
  2. Git详解

    Git详解

    2024-07-10 21:00:03      21 阅读
  3. Android12上实现双以太网卡共存同时访问外网

    2024-07-10 21:00:03       27 阅读
  4. c语言实战-极简扫雷

    2024-07-10 21:00:03       30 阅读
  5. 从零到一:构建股票预测模型的Python实战教程

    2024-07-10 21:00:03       25 阅读
  6. SpringBoot | 面试题

    2024-07-10 21:00:03       28 阅读
  7. Shell学习——Shell printf命令

    2024-07-10 21:00:03       26 阅读