El curso Análisis y ensamblaje de metagenomas se enfocará en métodos computacionales usados para analizar la riqueza de datos producidos por estudios de metagenómica y metatranscriptomica. Este curso le proporcionará información sobre los análisis de microorganismos, desde el preprocesamiento y el control de calidad de los datos r, extraccion del perfil de la comunidad, informacion funcional y la integraccion de estas. Ademas del uso de programas y herramientas bioinformaticas para el ensamblaje de genomas de microorganismos , predicion de genes y anotacion.
Objetivos general:
Aprender y aplicar técnicas bioinformáticas para estudiar comunidades microbianas con enfoques metagenómicos, así como s familiarizarse con las herramientas de análisis bioinformático y poder utilizarlas en la propia investigación después del curso.
Objetivos específicos:
• Aprender cómo ejecutar ensamblaje y anotación de metagenómica
• Realizar análisis metatranscriptómicos
• Adquirir la capacidad para reconstruir genomas ensamblados de metagenoma y verificar su calidad
• Comprender cómo obtener ayuda para preguntas tanto genómicas como computacionales
• Entender el uso de cluster/ servidores para alto procesamiento empleando un gestor de tareas
El curso tiene una duración de 20 h, repartidos en 4 horas diarias durante 5 días. Se llevará a cabo de forma teórico-práctico para que los estudiantes puedan en el futuro reproducir y adaptar los análisis vistos en clase a situaciones propias.
Profesionales, investigadores o estudiantes de posgrado preferiblemente que se encuentren realizando o planeen realizar investigaciones que requieran del análisis bioinformática de datos derivados de estudios de metagenómica, metetranscriptomica y ensamblaje de genomas.
Día 0. Guía cero.
1. Bash e Instalación de softwares para análisis metagenómicos
2. Video sobre la secuenciación masiva (30 min)
• Secuenciación Illumina
• Tipos de formatos: Fastqc
Día 1.
1. ¿Qué es la Metagenómica – Metatranscriptómica? (30 min)
2. Control de calidad (30 min)
• Lecturas sin procesar de filtrado de calidad
• Visualización con FastQC
• Recorte de lectura y eliminación de adaptadores
• Diagnóstico de bibliotecas deficientes
• Problemas comunes y mejores prácticas
3. Análisis Metatranscriptómicos (1 hora)
• Preprocesamiento: Control de calidad, Limpieza de datos, Filtrado de fragmentos de ARN ribosómico, Lecturas directas e inversas entrelazadas
• Extracción del perfil de la comunidad: Extraer la abundancia en los diferentes niveles taxonómicos y Visualización de la estructura de la comunidad
• Información funcional: Normalizar las abundancias, Identificar las familias de genes involucradas en las vías, Agrupar las abundancias en términos GO delgados
• Combinar información taxonómica y funcional
4. Guía para análisis metatranscriptómicos usando Galaxy (1 hora y tarea)
Día 2.
5. Revisión del flujo de trabajo bioinformático de tarea (30 min)
6. Identificación taxonómica, revisión de diferentes programas (30 min)
7. Ensamblaje y Evaluación usando diferentes bases de datos bioinformáticas (3 horas)
• Elección de ensambladores: consideraciones sobre los parámetros.
• Explorar las opciones del ensamblador
• Enviar trabajos a CIBIOFI a través del gestor de trabajos Condor
• Ejecutar el ensamblaje usando MetaSPAdes/MegaHit
• Evaluación de ensamblaje usando MetaQuast
Día 3.
8. Parámetros y estrategias clave para agrupar
• Mapeo
• Obtener perfiles de cobertura para contigs ensamblados mediante mapas de lectura
• Ordenaciones de nuestros datos agrupados usando VizBin
• Binning y bin check para recuperar genomas individuales
Día 4.
9. Predicción de genes (1hora)
• Predicción de genes usando prodigal, y otras herramientas (RNAmer, Aragorn, etc)
• Predecir marcos de lectura abiertos y secuencias de proteínas
10. Anotación (3 horas)
• Anotación de genes usando diamond y hmmer
• Discusión: Evaluando la calidad de la asignación de genes
• Discusión: Diferencias en taxonomías (GTDB, NCBI etc)
Día 5.
11. Anotación genética (parte 2) (3 horas)
• Uso de recursos en línea (por ejemplo, KEGG, BioCyc, MetaCyc, HydDB, PSORT)
• Ver la anotación de KEGG en el sitio web de KEGG
12. Discusión final
Inversion: 0.5 SMMLV ($450.000 COP)
Fecha límite de pago: pendiente de programación
Requisitos:
Fecha límite de inscripción y envío de documentos: pendiente de programación
Fechas propuestas para el inicio del Curso*
Fecha de Inicio: pendiente de programación
Fecha de Finalización: pendiente de programación
Intensidad horaria: 20 horas (4 horas diarias durante 5 sábados)
Horario: sábados de 8:00 a.m. a 12:00 m.
Modalidad: virtual
Docentes: Diana López y Nelson Rivera
Coordinador del curso: Andrés Castillo y Oficina de Extensión
Certificado: se otorga certificado de asistencia a las personas que tengan una participación de al menos 80% de las horas programadas.
* El inicio del curso está garantizado si se cumple con el número mínimo de inscritos.
Mayor información:
Oficina de Extensión
Teléfono: +57 (602) 3302461
Correo: Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.