0%

我们通常会通过直方图来观察数据的结构,但对于如何在R中实际地统计各个区间的数据频次却较少接触。因此,本文总结三种将连续变量离散化的操作:

1
2
3
ggplot2::cut_width()
ggplot2::cut_interval()
ggplot2::cut_number()
Read more »

问题描述

在使用boxplot描述数据时,离群值的存在会干扰boxplot可视化的结果。

Read more »

整理高通量测序数据分析中使用的软件。

samtools

比对软件产生的序列通常是随机的。然而,比对后的分析步骤通常要求sam/bam文件被进一步处理,例如在IGV查看比对结果时,常需要输入的bam文件已经被index。因此,本文将介绍samtools sort和samtools index命令。

Read more »

整理高通量测序数据分析中使用的软件。

samtools view

samtools是常用的对sam/bam文件操作的工具,其中samtools view命令可以实现查看序列、sam-bam文件转换、过滤序列等功能。下面用实际的例子简单介绍个人使用samtools view过程中的一些经验。

Read more »

sortmerna是一款检测文库中rRNA含量,并去除rRNA reads的软件。当怀疑文库中包含的rRNA比例较高时,这款软件可以派上用场。以下简单介绍它的安装与基本使用方法。

Read more »

整理ChIP-seq / CUT & Tag 分析时用到的工具。本文只对使用的工具用法进行简单介绍。

bedtools-intersect

当我们想判断两个基因组区域,例如两个peaks是否重叠时,可以使用bedtools intersect解决这种问题。

Read more »

整理ChIP-seq / CUT & Tag 分析时用到的工具。本文只对使用的工具用法进行简单介绍。

MACS2

MACS2是一款常用的peak calling软件,可以鉴定ChIP-seq/Cut&Tag数据的peaks,本文简单介绍MACS2的安装及peak calling的用法。

Read more »