GitHub

sncRNAseq_snakemake

Snakemake pipeline para identificacion de microRNAs usando miRDEEP2. Tiene la ventaja de usar paralelismos y tareas concurrentes. Ademas de tener checkpoints para cada tarea.

Como correr el pipeline: Una vez instalado los requisitos y snakemake ejecutar en la terminal: 'snakemake --cores = 0 --dry-run' Esto indicara el tumero de trabajos a realizar.

Este pipeline fue creado para realizar meta-analisis por lo que contempla la descarga de archivos fastq. De cualquier manera si, no es necesario descargar los archivos se pueden poner en una carpeta fastq que se encuentre al mismo nivel/ruta del archivo snakemake y los procesos de descarga

Input: - Archivo 'SRR_Acc_List.txt' con los archivos fastq a procesar. Uno por linea. - Genoma de referencia pre-indexado por Bowtie en carpeta BowtieIndex - microRNAs hairspins y maduros de miRBASe v22 u otra en formato fasta en carpeta mirbase_fa

Output: - descarga de todos los archivos fastq de GEO (opcional) - FASTQC pre-Trimming para todos los archivos. - FASTQ_trimmeados - FASTQC post-trimming - Tabla de Conteo de miRNAs encontrados - outputs standard de mirdeep2

NOTA:

Herramientas:

SRA-tools
CutAdapt
quantifier
mapper

El ambiente python de trabajo esta registrado en el archivo .yml

El flujo de trabajo es el siguiente:

Si los archivos fastq indicados en el archivo SRR_Acc_List.txt, no se encuentran localmente en la carpeta fastq, estos son descargados usando el modulo fasterq-dump de SRA-tools.
Luego se realiza un control de calidad usando fastQC. Es aconsejable evaluar la presencia de adaptadores y otros artefactos antes de correr el pipeline completo.
Se realiza un trimmeo para eliminar adaptadores, lecturas de mala calidad y lecturas de tamaño no deseado. Cutadapt.
Segundo control de calidad con fastQC, verificar trimming.
mappeo de lecutras contra el genoma de referencia usando Mapper.pl (modulo de miRDeep2, que funciona como wrapper de Bowtie)
Cuantificacion de aliniamiento usando quantifier.pl (modulo de miRDeep2)

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
README.md		README.md
snakefile		snakefile
snakemake_environment.yml		snakemake_environment.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

sncRNAseq_snakemake

About

Releases

Packages

CFVALLS/sncRNA_snakemake

Folders and files

Latest commit

History

Repository files navigation

sncRNAseq_snakemake

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages