1. Análisis de la secuencia humana y presentación oral de los resultados (30 puntos)
Este trabajo se defiende en forma de seminario los días 11/12 de febrero
El análisis debe de comprender mínimamente los siguientes puntos
- Las coordenadas cromosómicas de la secuencia en dos ensamblados diferentes
- El gen que contiene:
- Descripción del gen: número isoformas (RefSeq), número de exones
- Función del gen
- Tabla con el uso de codones
- Una filogenia usando al menos 5 genes homólogos.
- Analísis composicional de la secuencia
- Análisis de la fluctuación del contenido en G+C
- ¿Existen picos y valles?
- ¿A que corresponden?
- Análisis de la composición en dinucleótidos
2 Caracterización del ensamblado y elaboración de un informe
Fecha límite de entrega: 4 de marzo 2024.
El informe han de un constar los resultados que hemos obtenido en las clases presenciales junto con una breve descripción como se han obtenido (10 puntos).
Adicionalmente (10 puntos):
- determinar un genoma de referencia
- anotar los genes ribosómicos en el ensamblado
- determinar las coordenadas de los 5 contigs mas largos en el genoma de referencia
Caracterizar la calidad del ensambladoCalcular en G+C del ensambladoPredecir genes codificantesCuantos genes codificantes se predicenQue % del ensamblado cubren los genes codificantes
Anotar los genes predichos¿Que parámetros del Blast influyen en el % de genes predichos anotados?
Analizar la variación en el G+C a lo largo del contig mas largo¿Podemos determinar el orden real de los contigs en el genoma?Detectar genes del ARN ribosómicoDeterminar el uso de codones¿Los genes predichos tienen un uso de codones diferentes comparado con la anotación del genoma de referencia?¿Los genes de resistencia tienen un uso de codones diferentes?