怎样使用 Juicer tools 的 dump 命令将.hic文件转换为交互矩阵matrix计数文件 (Windows)

创作日志: 万恶的生信…一个scHiC数据集没有提供处理好的计数文件,需要从.hic转换。Github一个个好长的文档看了好久才定位到 juicer tools 的dump命令,使用起来比想象中简单。


一、下载Juicer tools

注意:使用Juicer tools的前提是你的电脑里装了Java哦!

网址:Juicer tools jar包下载官网
我不知道有什么具体区别,下载的是第一个。下载之后也不需要有什么操作,直接就可以用。

在这里插入图片描述

二、dump命令讲解

1. juicer_tools dump 用法1——提取观测值或期望值

  • 参数:
    [ observed/oe ]   [ NONE/VC/VC_SQRT/KR ]   [ hicFile(s) ]   [ chr1 ][:x1:x2]   [ chr2 ][:y1:y2]   [ BP/FRAG ]   [ binsize ]   [ outfile (可选) ]

  • 参数解释:
    • [observed/oe]: 选择提取观测值 (observed) 或 观测/期望值 (oe)。
    • [NONE/VC/VC_SQRT/KR]: 选择归一化选项:
             NONE:无归一化
             VC:Vector Correction 归一化
             VC_SQRT:Square Root Vector Correction 归一化
             KR:Knight-Ruiz 归一化
    • [hicFile(s)]: 输入的 .hic 文件路径。
    • [chr1][:x1:x2]: 第一个染色体及其范围(例如 chr1:0:100000)。
    • [chr2][:y1:y2]: 第二个染色体及其范围(例如 chr2:0:100000),也可以是相同的染色体。
    • [BP/FRAG]: 选择单位:基对 (BP) 或 酶切片段 (FRAG)。
    • [binsize]: 分辨率,例如 10000 表示 10kb。
    • [outfile]: 输出文件路径(可选)。

2. juicer_tools dump 用法2——提取归一化或期望值

  • 参数:
    [ norm/expected ]   [ NONE/VC/VC_SQRT/KR ]   [ hicFile(s) ]   [ chr ]   [ BP/FRAG ]   [ binsize ]   [ outfile (可选) ]
  • 参数解释:
    • [norm/expected]:选择提取归一化值 (norm) 或 期望值 (expected)。
    • [NONE/VC/VC_SQRT/KR]:选择归一化选项(同上)。
    • [hicFile(s)]:输入的 .hic 文件路径。
    • [chr]:染色体。
    • [BP/FRAG]:选择单位:基对 (BP) 或 酶切片段 (FRAG)。
    • [binsize]:分辨率。
    • [outfile]:输出文件路径(可选)。

3. juicer_tools dump 用法3——提取染色质环loop或域domain信息

  • 参数:
    [ loops/domains ]   [ hicFile URL]   [ outfile (可选) ]
  • 参数解释:
    • [loops/domains]:选择提取环 (loops) 或 域 (domains) 信息。
    • :输入的 .hic 文件 URL。
    • [outfile]:输出文件路径(可选)。

三、使用实例

  1. 打开Windows cmd
  2. 输入java -jar 你的juicer_tools jar包安装路径 dump 以上所需参数 即可完成转换

拿我的举个例子:
在这里插入图片描述
最后在我的指定路径中生成了extract_matrix.txt文件:

在这里插入图片描述

打开内容是这样的:

在这里插入图片描述

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-22 20:48:03       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-22 20:48:03       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-22 20:48:03       45 阅读
  4. Python语言-面向对象

    2024-07-22 20:48:03       55 阅读

热门阅读

  1. 机器学习中的数据分析

    2024-07-22 20:48:03       15 阅读
  2. C++ STL标准数据库详解

    2024-07-22 20:48:03       17 阅读
  3. POI导入导出

    2024-07-22 20:48:03       15 阅读
  4. Python数据预处理和特征工程

    2024-07-22 20:48:03       15 阅读
  5. python函数基础详解

    2024-07-22 20:48:03       16 阅读
  6. AES加密/解密算法实现(C)

    2024-07-22 20:48:03       15 阅读
  7. 计数排序(桶排序思想)

    2024-07-22 20:48:03       12 阅读